Skip to content

模块 5 · RAG 质量评测

产出:建立评测集,用指标量化检索质量和答案质量,能分析 Bad Case 并回归验证。

本模块回答一个基础课留下的问题:"感觉回答还行"怎么变成"有数据支撑的 XX% 准确率"?

课次标题内容
课 1评测集与检索指标标注 Q&A 数据集、Hit Rate、MRR、Recall@K
课 2LLM-as-a-judgeFaithfulness、Answer Relevance、Context Precision
课 3Bad Case 分析与回归坏例分类、根因分析、回归测试防退化

面向前端工程师和独立开发者的 AI 应用工程课程