Appearance
检索策略
RAG 好不好,很大程度取决于检索设计。
这节课解决什么问题
- 文档怎么切块更合理
- 为什么 Dense 检索不总是够用
- Hybrid 检索在什么场景更稳
核心内容
- Chunking
- Dense 检索
- Sparse 检索
- Hybrid 检索
本节产物
- 一份 chunk 策略对比结果
- 一组 Dense、Sparse、Hybrid 检索样例
- 一份召回效果对比报告
课堂实作
- 对同一批文档试三种切块方式并观察召回变化
- 对同一个问题比较 Dense、Sparse、Hybrid 的返回结果
- 总结在哪些问题上关键词检索更稳,哪些问题更依赖语义检索
并入项目
这一课会直接进入项目二知识库 Agent 的召回层。
面试会怎么问
- 为什么 chunk 太大或太小都不好
- Dense 和 Sparse 各自的优缺点是什么
- 什么场景必须做 Hybrid 检索
