Appearance
主线项目:智能知识库 Agent
这门课围绕一个真实产品贯穿始终:一个本地优先的智能知识库 Agent。 每个模块学完,产品就多一层能力;课程结束,你手上有一个可运行、可展示、能写进简历的工具。
产品目标
构建一个能记住你的文档、理解你的问题、代替你完成知识性任务的本地 Agent:
- 导入:把文档、网页、目录变成可被检索的知识
- 问答:用自然语言向知识库提问,并给出带来源引用的回答
- 写作:基于知识库内容生成报告、摘要、结构化文档
- 规划:Agent 自主拆解多步任务,依次调用工具完成目标
- 记忆:跨会话保留上下文,不需要每次重新交代背景
一句话:一个能帮你"看书、搜索、做事"的本地 AI 工具。
产品架构
智能知识库 Agent:五层架构
用户入口
自然语言请求让 Agent 自主判断意图
Slash 指令/add、/ask、/write、/status
本地 REPL演示和日常使用入口
↓
本地交互层
命令解析识别指令和参数
会话控制创建、切换、恢复会话
结果输出把工具结果和模型回答呈现给用户
Agent 编排层
System Prompt角色、规则、输出格式、安全边界
ReAct + Tool Call多步推理和工具执行
Todo / SubAgent / 写作流规划、委派和多 Agent 协作
↓
核心能力层
知识库管理create / use / list / remove / status
摄入链路文本、URL、文件 → 切块 → Embedding
检索与问答BM25 + 向量检索 + RRF + 来源引用
内容任务摘要、写作、长期记忆读写
↓
质量与评测层
输出约束
重试 / 缓存
成本统计
检索评测bm25 / vector / hybrid
结果评测ask / summarize / write
本地存储层
~/.kb/config.json当前知识库和全局配置
知识库 .sqlite文档、分块、FTS5、向量索引
sessions.sqlite会话历史、计划、日志
五层各司其职,交互层只负责输入输出,Agent 层只负责推理决策,核心层只负责稳定的业务能力。
为什么按这个顺序学
这个产品表面上是个 Agent,但它的每一层能力都对应课程里一个独立的技术决策。
先学 Chatbot(模块 1-2):打通对话链路,搞清楚 context window 和 System Prompt
Agent 的底层是一个会对话的 LLM。如果不知道 context window 是什么、System Prompt 怎么控制行为,后面的 RAG 和 Agent 都会变成黑盒操作。从聊天开始,能让你在最短时间内看到"模型是怎么接收输入、产生输出的",从而建立准确的心智模型。
再学 RAG(模块 3-4):给 Agent 装上长期记忆
大模型的 context window 有上限。要让 Agent 能回答"你上周给我的那份文档说了什么",需要把文档变成向量、存进数据库、在对话时按需检索进来。RAG 这一层是连接静态知识和动态对话的桥梁,没有它,Agent 的问答能力是假的——每次都是从零开始。
最后学 Agent(模块 5-8):让 AI 从"回答问题"变成"完成任务"
Chatbot 能聊,RAG 能查,但还做不到"帮我把这个目录里的文档都导入知识库,然后生成一份阅读摘要"。这种多步目标需要 Tool Call、ReAct 推理和 Multi-Agent 协作。Agent 层是整个产品最复杂的部分,但有了前面的基础,你会发现它本质上是对 Chatbot + RAG 能力的编排,而不是全新的系统。
课程演进路径:
模块 1-2 → 跑通对话,掌握 Prompt
模块 3-4 → 加入知识库,检索可量化
模块 5-6 → 变成 Agent,能多步执行
模块 7 → 多 Agent 协作
模块 8 → 质量、评测、工程化上线每个模块结束后,可以运行对应的 basic/examples Demo 观察单点能力;课程最终交付统一收束到 basic/project。