快速模式

CASSIA 的快速模式提供了一个简化的、一站式解决方案。该模式在单个函数调用中结合了注释、评分和注释增强等智能体。

总的来说，CASSIA的主要注释agent（智能体）和检查agent 首先会接收到marker文件，并互相沟通以得出初步的注释结果与逻辑推理，之后评估agent 会对注释的结果进行打分，如果分数低于阈值的注释会被送到注释增强agent 中继续分析，注释增强agent 可以阅读整个marker文件而不是仅仅topn的marker。这一个工作流结束之后，你会得到三份文件，分别是基本注释的报告，注释结果的表格，和注释增强的结果报告。

选定要使用的模型

如果你使用 OpenRouter 作为提供商，即可以自由使用几乎任何大模型，你还可以为runCASSIA_pipeline的每个agent指定不同的模型，推荐评分agent和主要注释agent选择不同的大模型，以下是一些模型推荐：

Claude 3.5 Sonnet (性能最佳)
- 模型 ID: "anthropic/claude-3.5-sonnet"
GPT-4o (均衡选项)
- 模型 ID: "openai/gpt-4o-2024-11-20"
deepseekv3 (几乎免费且效果接近4o，最推荐)
- 模型 ID: "deepseek/deepseek-chat-v3-0324" 或者 "deepseek/deepseek-chat-v3-0324:free" (免费！每天有50次限制，但如果充值10美金到openrouter里，限制提高到1000次每天。)

基本用法

runCASSIA_pipeline(
    output_file_name = "my_analysis",
    tissue = "brain",
    species = "human",
    marker = marker_data,
    max_workers = 4
)

完整参数选项

runCASSIA_pipeline(
    # 必需参数
    output_file_name,     # 输出文件的基本名称
    tissue,               # 组织类型（例如，"brain"、"blood"）
    species,              # 物种（例如，"human"、"mouse"）
    marker,               # 来自 findallmarker 的标记文件，路径或数据对象
    
    # 带默认值的可选参数
    max_workers = 4,      # 并行工作线程数
    
    # 模型配置
    annotation_model = "gpt-4o",             # 用于注释的模型
    annotation_provider = "openai",         # 用于注释的模型的提供商
    score_model = "anthropic/claude-3.5-sonnet",  # 用于评分的模型
    score_provider = "openrouter",         # 用于评分的模型的提供商
    annotationboost_model="anthropic/claude-3.5-sonnet", #用于注释增强的模型
    annotationboost_provider="openrouter", #用于注释增强的模型的提供商
    
    # 分析参数
    score_threshold = 75,     # 最低可接受分数
    additional_info = NULL    # 额外的上下文信息
)

输出文件

该流程生成：

初始注释结果
质量评分和推理过程
摘要报告
注释增强报告

CASSIA + Seurat

CASSIA的注释结果可以直接转化到Seurat中使用下面的方法

cassia_results_path <- "path to your _score.csv" #填入评估agent的输出文件

# Test the function
seurat_obj <- add_cassia_to_seurat(
  seurat_obj = seurat_obj,  #所使用的Seurat文件
  cassia_results_path = cassia_results_path,
  cluster_col = "celltype", # Seurat文件中对应的标注列
  cassia_cluster_col="True.Cell.Type" #CASSIA结果中的簇名，如果没有更改不需要特别指定
)

性能提示

为获得最佳性能，请根据系统的 CPU 核心数调整 max_workers
使用 additional_info 提供相关的实验上下文
监控 score_threshold 以平衡严格性和吞吐量

接下来我们将详细介绍每个函数...

设置 CASSIA 单聚类注释