全量聊天记录

很多人第一次做 chatbot，最疑惑的不是模型怎么回，而是为什么每次请求都要把前面的对话重新带上。

这节课解决什么问题

大多数模型接口，本质上都是“本次请求看本次输入”。

这意味着：

所以 chatbot 的短期记忆，不是模型自己记住了，而是程序替它保存了消息历史，并在下一轮请求里重新发给它。

如果上一轮是：

{ role: 'user', content: '解释一下什么是闭包' }

下一轮你只传：

{ role: 'user', content: '那它和普通函数有什么区别？' }

模型其实不知道这里的“它”指什么。

只有把前面的 system、user、assistant 都一起带上，模型才知道你在继续同一段对话。

chatbot 的短期记忆，本质上就是：

所以后面你会看到一个很现实的问题：

历史越长，输入越大；输入越大，越慢、越贵，也越容易被无关内容污染。

这一课会直接变成后面所有多轮对话和 Agent Loop 的输入基础。