Skip to content

检索策略

RAG 好不好,很大程度取决于检索设计。


这节课解决什么问题

  • 文档怎么切块更合理
  • 为什么 Dense 检索不总是够用
  • Hybrid 检索在什么场景更稳

核心内容

  • Chunking
  • Dense 检索
  • Sparse 检索
  • Hybrid 检索

本节产物

  • 一份 chunk 策略对比结果
  • 一组 Dense、Sparse、Hybrid 检索样例
  • 一份召回效果对比报告

课堂实作

  • 对同一批文档试三种切块方式并观察召回变化
  • 对同一个问题比较 Dense、Sparse、Hybrid 的返回结果
  • 总结在哪些问题上关键词检索更稳,哪些问题更依赖语义检索

并入项目

这一课会直接进入项目二知识库 Agent 的召回层。

面试会怎么问

  • 为什么 chunk 太大或太小都不好
  • Dense 和 Sparse 各自的优缺点是什么
  • 什么场景必须做 Hybrid 检索

大齐 AI 课堂 · 程序员的 Agent 开发课