快速模式

快速模式

CASSIA 的快速模式提供了一个简化的、一站式解决方案。该模式在单个函数调用中结合了注释、评分和注释增强等智能体。

总的来说,CASSIA的 主要注释agent(智能体) 和 检查agent 首先会接收到marker文件,并互相沟通以得出初步的注释结果与逻辑推理,之后 评估agent 会对注释的结果进行打分,如果分数低于阈值的注释会被送到 注释增强agent 中继续分析,注释增强agent 可以阅读整个marker文件而不是仅仅topn的marker。这一个工作流结束之后,你会得到三份文件,分别是基本注释的报告,注释结果的表格,和注释增强的结果报告。

选定要使用的模型

如果你使用 OpenRouter 作为提供商,即可以自由使用几乎任何大模型,你还可以为runCASSIA_pipeline的每个agent指定不同的模型,推荐评分agent和主要注释agent选择不同的大模型,以下是一些模型推荐:

  • Claude 3.5 Sonnet (性能最佳)
    • 模型 ID: "anthropic/claude-3.5-sonnet"
  • GPT-4o (均衡选项)
    • 模型 ID: "openai/gpt-4o-2024-11-20"
  • deepseekv3 (几乎免费且效果接近4o,最推荐)
    • 模型 ID: "deepseek/deepseek-chat-v3-0324" 或者 "deepseek/deepseek-chat-v3-0324:free" (免费!每天有50次限制,但如果充值10美金到openrouter里,限制提高到1000次每天。)

基本用法

runCASSIA_pipeline(
    output_file_name = "my_analysis",
    tissue = "brain",
    species = "human",
    marker = marker_data,
    max_workers = 4
)

完整参数选项

runCASSIA_pipeline(
    # 必需参数
    output_file_name,     # 输出文件的基本名称
    tissue,               # 组织类型(例如,"brain"、"blood")
    species,              # 物种(例如,"human"、"mouse")
    marker,               # 来自 findallmarker 的标记文件,路径或数据对象
    
    # 带默认值的可选参数
    max_workers = 4,      # 并行工作线程数
    
    # 模型配置
    annotation_model = "gpt-4o",             # 用于注释的模型
    annotation_provider = "openai",         # 用于注释的模型的提供商
    score_model = "anthropic/claude-3.5-sonnet",  # 用于评分的模型
    score_provider = "openrouter",         # 用于评分的模型的提供商
    annotationboost_model="anthropic/claude-3.5-sonnet", #用于注释增强的模型
    annotationboost_provider="openrouter", #用于注释增强的模型的提供商
    
    # 分析参数
    score_threshold = 75,     # 最低可接受分数
    additional_info = NULL    # 额外的上下文信息
)

输出文件

该流程生成:

  1. 初始注释结果
  2. 质量评分和推理过程
  3. 摘要报告
  4. 注释增强报告

CASSIA + Seurat

CASSIA的注释结果可以直接转化到Seurat中使用下面的方法

cassia_results_path <- "path to your _score.csv" #填入评估agent的输出文件

# Test the function
seurat_obj <- add_cassia_to_seurat(
  seurat_obj = seurat_obj,  #所使用的Seurat文件
  cassia_results_path = cassia_results_path,
  cluster_col = "celltype", # Seurat文件中对应的标注列
  cassia_cluster_col="True.Cell.Type" #CASSIA结果中的簇名,如果没有更改不需要特别指定
)

性能提示

  • 为获得最佳性能,请根据系统的 CPU 核心数调整 max_workers
  • 使用 additional_info 提供相关的实验上下文
  • 监控 score_threshold 以平衡严格性和吞吐量

接下来我们将详细介绍每个函数...