Appearance
模型能力边界
这一课的重点是知道模型能做什么,不能做什么。
这节课解决什么问题
- 幻觉为什么会发生
- 知识截止为什么会影响 Agent
- 大模型和小模型在 Agent 系统里怎么分工
关键概念
- 幻觉:模型在缺乏可靠依据时生成看似合理的内容
- 知识截止:模型参数内知识不是实时更新的
- 能力边界:不同模型在推理、工具使用、成本上各有取舍
对 Agent 开发的直接影响
- 事实问题优先交给检索和工具,而不是只靠模型记忆
- 高风险动作要加验证和人工确认
- 路由、分类、过滤可以交给更轻的模型
本节产物
- 一份模型能力边界判断清单
- 一份大模型和小模型分工草案
- 一份高风险任务的验证规则
课堂实作
- 把手头任务分成适合靠模型完成、适合靠工具完成、必须人工确认三类
- 为一个 Agent 流程补上验证步骤和人工确认点
- 写出一版大模型做规划、小模型做路由的分工方案
并入项目
这一课会直接进入项目一的权限设计、项目二的检索兜底,以及项目三的模型分工。
面试会怎么问
- 幻觉的根源是什么
- 为什么 RAG 能缓解知识截止问题
- 什么场景适合大模型,什么场景适合小模型
