质量评分
质量评分有助于评估细胞类型注释的可靠性。CASSIA 通过 runCASSIA_score_batch 函数提供自动评分功能,该函数分析每个注释背后的推理和证据。
运行质量评分
基本用法
runCASSIA_score_batch(
input_file = "my_annotation_full.csv",
output_file = "my_annotation_scored.csv",
max_workers = 4,
model = "anthropic/claude-3.5-sonnet",
provider = "openrouter"
)参数详情
-
输入/输出文件:
input_file: 完整注释结果的路径(来自runCASSIA_batch)output_file: 保存评分结果的位置
-
处理参数:
max_workers: 并行评分线程的数量- 推荐:如果提供商设置为 anthropic,使用的 worker 数量应少于注释步骤,以避免 API 限制
-
模型配置:
- 推荐模型:
anthropic/claude-3.5-sonnet - 推荐提供商:
openrouter
- 推荐模型:
API 提供商注意事项
OpenRouter
- 优点:
- 更高的速率限制
- 易于切换模型
- 设置:
provider <- "openrouter" model <- "anthropic/claude-3.5-sonnet"
Anthropic Direct
- 注意事项:
- 新用户有使用限制
- 可能需要减少
max_workers - 更适合较小的数据集
- 设置:
provider <- "anthropic" model <- "claude-3-5-sonnet-20241022"
输出格式
评分后的输出文件包含:
- 原始注释数据
- 质量评分(0-100)
- 置信度指标
- 评分的详细推理
解读评分
- 90-100: 高置信度,强有力证据
- 76-89: 良好置信度,充分证据
- <75: 低置信度,需要通过 Annotation Boost Agent 和 Compare Agent 进行验证
报告生成
从您的分析中生成详细报告。此步骤通常在质量评分之后进行。
评分报告包括 CASSIA 的所有输出,包括结构化输出、对话历史和质量评分。
从评分结果生成批量报告
runCASSIA_generate_score_report(
csv_path = "my_annotation_scored.csv",
output_name = "CASSIA_reports_summary"
)从 scored_results.csv 生成单独的报告和索引页面。