注释增强(ValidationPlus)
注释增强是一种高级验证工具,通过多次迭代分析来提高注释置信度。它特别适用于:
- 验证低置信度注释
- 获取特定细胞聚类的详细见解
- 解决模糊的细胞类型分配
- 生成全面的验证报告
所需组件
-
输入数据:
- CASSIA 批处理分析的完整结果 CSV
- 原始标记基因文件(Seurat findallmarkers 输出)
- 聚类的上下文信息
-
模型配置:
- 推荐使用智能程度较高的模型:通过 OpenRouter 使用
anthropic/claude-3.7-sonnet
- 推荐使用智能程度较高的模型:通过 OpenRouter 使用
运行注释增强
# 设置参数
validation_config <- list(
model = "anthropic/claude-3.7-sonnet",
provider = "openrouter"
)
# 定义聚类信息
cluster_info <- "Human PBMC"
# 指定要验证的聚类,即聚类的名字,这里我们已经知道聚类的细胞种类,正常情况下这可能是一个数字例如cluster_1,cluster_2,cluster_3等
target_cluster = "CD4+ T cell"
# 运行验证
runCASSIA_validatorplus(
# 必需参数
full_result_path = "cell_type_analysis_results.csv",
marker = marker_data,
cluster_name = target_cluster,
major_cluster_info = cluster_info,
output_name = "Cluster1_report",
num_iterations = 5, # 验证轮数
# 模型配置
model = validation_config$model,
provider = validation_config$provider,
)参数详情
full_result_path:原始 CASSIA 结果的路径marker:标记基因数据(与初始分析中使用的相同)cluster_name:目标聚类名称major_cluster_info:数据集上下文num_iterations:验证轮数(默认:5)
故障排除
-
低置信度结果:
- 增加
num_iterations - 审查标记基因质量
- 增加
-
结果不一致:
- 检查标记基因一致性
- 验证输入数据质量