主线项目：智能知识库 Agent

这门课围绕一个真实产品贯穿始终：一个本地优先的智能知识库 Agent。每个模块学完，产品就多一层能力；课程结束，你手上有一个可运行、可展示、能写进简历的工具。

产品目标

构建一个能记住你的文档、理解你的问题、代替你完成知识性任务的本地 Agent：

导入：把文档、网页、目录变成可被检索的知识
问答：用自然语言向知识库提问，并给出带来源引用的回答
写作：基于知识库内容生成报告、摘要、结构化文档
规划：Agent 自主拆解多步任务，依次调用工具完成目标
记忆：跨会话保留上下文，不需要每次重新交代背景

一句话：一个能帮你"看书、搜索、做事"的本地 AI 工具。

产品架构

智能知识库 Agent：五层架构

用户入口

自然语言请求让 Agent 自主判断意图

Slash 指令/add、/ask、/write、/status

本地 REPL演示和日常使用入口

↓

本地交互层

命令解析识别指令和参数

会话控制创建、切换、恢复会话

结果输出把工具结果和模型回答呈现给用户

Agent 编排层

System Prompt角色、规则、输出格式、安全边界

ReAct + Tool Call多步推理和工具执行

Todo / SubAgent / 写作流规划、委派和多 Agent 协作

↓

核心能力层

知识库管理create / use / list / remove / status

摄入链路文本、URL、文件 → 切块 → Embedding

检索与问答BM25 + 向量检索 + RRF + 来源引用

内容任务摘要、写作、长期记忆读写

↓

质量与评测层

输出约束

重试 / 缓存

成本统计

检索评测bm25 / vector / hybrid

结果评测ask / summarize / write

本地存储层

~/.kb/config.json当前知识库和全局配置

知识库 .sqlite文档、分块、FTS5、向量索引

sessions.sqlite会话历史、计划、日志

五层各司其职，交互层只负责输入输出，Agent 层只负责推理决策，核心层只负责稳定的业务能力。

为什么按这个顺序学

这个产品表面上是个 Agent，但它的每一层能力都对应课程里一个独立的技术决策。

先学 Chatbot（模块 1-2）：打通对话链路，搞清楚 context window 和 System Prompt

Agent 的底层是一个会对话的 LLM。如果不知道 context window 是什么、System Prompt 怎么控制行为，后面的 RAG 和 Agent 都会变成黑盒操作。从聊天开始，能让你在最短时间内看到"模型是怎么接收输入、产生输出的"，从而建立准确的心智模型。

再学 RAG（模块 3-4）：给 Agent 装上长期记忆

大模型的 context window 有上限。要让 Agent 能回答"你上周给我的那份文档说了什么"，需要把文档变成向量、存进数据库、在对话时按需检索进来。RAG 这一层是连接静态知识和动态对话的桥梁，没有它，Agent 的问答能力是假的——每次都是从零开始。

最后学 Agent（模块 5-8）：让 AI 从"回答问题"变成"完成任务"

Chatbot 能聊，RAG 能查，但还做不到"帮我把这个目录里的文档都导入知识库，然后生成一份阅读摘要"。这种多步目标需要 Tool Call、ReAct 推理和 Multi-Agent 协作。Agent 层是整个产品最复杂的部分，但有了前面的基础，你会发现它本质上是对 Chatbot + RAG 能力的编排，而不是全新的系统。

课程演进路径：

模块 1-2 → 跑通对话，掌握 Prompt
模块 3-4 → 加入知识库，检索可量化
模块 5-6 → 变成 Agent，能多步执行
模块 7   → 多 Agent 协作
模块 8   → 质量、评测、工程化上线

每个模块结束后，可以运行对应的 basic/examples Demo 观察单点能力；课程最终交付统一收束到 basic/project。

主线项目：智能知识库 Agent ​

产品目标 ​

产品架构 ​

为什么按这个顺序学 ​

主线项目：智能知识库 Agent

产品目标

产品架构

为什么按这个顺序学