注释增强(可选)

注释增强(ValidationPlus)

注释增强是一种高级验证工具,通过多次迭代分析来提高注释置信度。它特别适用于:

  • 验证低置信度注释
  • 获取特定细胞聚类的详细见解
  • 解决模糊的细胞类型分配
  • 生成全面的验证报告

所需组件

  1. 输入数据:

    • CASSIA 批处理分析的完整结果 CSV
    • 原始标记基因文件(Seurat findallmarkers 输出)
    • 聚类的上下文信息
  2. 模型配置:

    • 推荐使用智能程度较高的模型:通过 OpenRouter 使用 anthropic/claude-3.7-sonnet

运行注释增强

# 设置参数
validation_config <- list(
    model = "anthropic/claude-3.7-sonnet",
    provider = "openrouter"
)

# 定义聚类信息
cluster_info <- "Human PBMC"

# 指定要验证的聚类,即聚类的名字,这里我们已经知道聚类的细胞种类,正常情况下这可能是一个数字例如cluster_1,cluster_2,cluster_3等
target_cluster = "CD4+ T cell"

# 运行验证
runCASSIA_validatorplus(

    # 必需参数
    full_result_path = "cell_type_analysis_results.csv",
    marker = marker_data,
    cluster_name = target_cluster,
    major_cluster_info = cluster_info,
    output_name = "Cluster1_report",
    num_iterations = 5, # 验证轮数

    # 模型配置
    model = validation_config$model,
    provider = validation_config$provider,
)

参数详情

  • full_result_path:原始 CASSIA 结果的路径
  • marker:标记基因数据(与初始分析中使用的相同)
  • cluster_name:目标聚类名称
  • major_cluster_info:数据集上下文
  • num_iterations:验证轮数(默认:5)

故障排除

  1. 低置信度结果:

    • 增加 num_iterations
    • 审查标记基因质量
  2. 结果不一致:

    • 检查标记基因一致性
    • 验证输入数据质量