Skip to content

模型能力边界

这一课的重点是知道模型能做什么,不能做什么。


这节课解决什么问题

  • 幻觉为什么会发生
  • 知识截止为什么会影响 Agent
  • 大模型和小模型在 Agent 系统里怎么分工

关键概念

  • 幻觉:模型在缺乏可靠依据时生成看似合理的内容
  • 知识截止:模型参数内知识不是实时更新的
  • 能力边界:不同模型在推理、工具使用、成本上各有取舍

对 Agent 开发的直接影响

  • 事实问题优先交给检索和工具,而不是只靠模型记忆
  • 高风险动作要加验证和人工确认
  • 路由、分类、过滤可以交给更轻的模型

本节产物

  • 一份模型能力边界判断清单
  • 一份大模型和小模型分工草案
  • 一份高风险任务的验证规则

课堂实作

  • 把手头任务分成适合靠模型完成、适合靠工具完成、必须人工确认三类
  • 为一个 Agent 流程补上验证步骤和人工确认点
  • 写出一版大模型做规划、小模型做路由的分工方案

并入项目

这一课会直接进入项目一的权限设计、项目二的检索兜底,以及项目三的模型分工。

面试会怎么问

  • 幻觉的根源是什么
  • 为什么 RAG 能缓解知识截止问题
  • 什么场景适合大模型,什么场景适合小模型

大齐 AI 课堂 · 程序员的 Agent 开发课