快速模式
CASSIA 的快速模式提供了一个简化的、一站式解决方案。该模式在单个函数调用中结合了注释、评分和注释增强等智能体。
总的来说,CASSIA的 主要注释agent(智能体) 和 检查agent 首先会接收到marker文件,并互相沟通以得出初步的注释结果与逻辑推理,之后 评估agent 会对注释的结果进行打分,如果分数低于阈值的注释会被送到 注释增强agent 中继续分析,注释增强agent 可以阅读整个marker文件而不是仅仅topn的marker。这一个工作流结束之后,你会得到三份文件,分别是基本注释的报告,注释结果的表格,和注释增强的结果报告。
选定要使用的模型
如果你使用 OpenRouter 作为提供商,即可以自由使用几乎任何大模型,你还可以为runCASSIA_pipeline的每个agent指定不同的模型,推荐评分agent和主要注释agent选择不同的大模型,以下是一些模型推荐:
- Claude 3.5 Sonnet (性能最佳)
- 模型 ID:
"anthropic/claude-3.5-sonnet"
- 模型 ID:
- GPT-4o (均衡选项)
- 模型 ID:
"openai/gpt-4o-2024-11-20"
- 模型 ID:
- deepseekv3 (几乎免费且效果接近4o,最推荐)
- 模型 ID:
"deepseek/deepseek-chat-v3-0324"或者 "deepseek/deepseek-chat-v3-0324:free" (免费!每天有50次限制,但如果充值10美金到openrouter里,限制提高到1000次每天。)
- 模型 ID:
基本用法
runCASSIA_pipeline(
output_file_name = "my_analysis",
tissue = "brain",
species = "human",
marker = marker_data,
max_workers = 4
)完整参数选项
runCASSIA_pipeline(
# 必需参数
output_file_name, # 输出文件的基本名称
tissue, # 组织类型(例如,"brain"、"blood")
species, # 物种(例如,"human"、"mouse")
marker, # 来自 findallmarker 的标记文件,路径或数据对象
# 带默认值的可选参数
max_workers = 4, # 并行工作线程数
# 模型配置
annotation_model = "gpt-4o", # 用于注释的模型
annotation_provider = "openai", # 用于注释的模型的提供商
score_model = "anthropic/claude-3.5-sonnet", # 用于评分的模型
score_provider = "openrouter", # 用于评分的模型的提供商
annotationboost_model="anthropic/claude-3.5-sonnet", #用于注释增强的模型
annotationboost_provider="openrouter", #用于注释增强的模型的提供商
# 分析参数
score_threshold = 75, # 最低可接受分数
additional_info = NULL # 额外的上下文信息
)输出文件
该流程生成:
- 初始注释结果
- 质量评分和推理过程
- 摘要报告
- 注释增强报告
CASSIA + Seurat
CASSIA的注释结果可以直接转化到Seurat中使用下面的方法
cassia_results_path <- "path to your _score.csv" #填入评估agent的输出文件
# Test the function
seurat_obj <- add_cassia_to_seurat(
seurat_obj = seurat_obj, #所使用的Seurat文件
cassia_results_path = cassia_results_path,
cluster_col = "celltype", # Seurat文件中对应的标注列
cassia_cluster_col="True.Cell.Type" #CASSIA结果中的簇名,如果没有更改不需要特别指定
)性能提示
- 为获得最佳性能,请根据系统的 CPU 核心数调整
max_workers - 使用
additional_info提供相关的实验上下文 - 监控
score_threshold以平衡严格性和吞吐量
接下来我们将详细介绍每个函数...