Appearance
模块 5 · RAG 质量评测
产出:建立评测集,用指标量化检索质量和答案质量,能分析 Bad Case 并回归验证。
本模块回答一个基础课留下的问题:"感觉回答还行"怎么变成"有数据支撑的 XX% 准确率"?
| 课次 | 标题 | 内容 |
|---|---|---|
| 课 1 | 评测集与检索指标 | 标注 Q&A 数据集、Hit Rate、MRR、Recall@K |
| 课 2 | LLM-as-a-judge | Faithfulness、Answer Relevance、Context Precision |
| 课 3 | Bad Case 分析与回归 | 坏例分类、根因分析、回归测试防退化 |