摘要
现代智能体系统依赖大语言模型作为灵活的决策引擎。要理解这些系统如何工作,你不需要了解模型训练的每一个细节。你需要的是一小组概念,用来解释为什么 LLM 擅长指令、规划、工具选择和综合。为什么这很重要
在产品层,LLM 往往被当作魔法。这会导致糟糕的设计决策。- 有些团队以为模型记得比实际更多
- 有些团队以为模型在进行符号推理,但它其实主要受模式驱动
- 有些团队把上下文当作免费资源,尽管它是主要的运行预算
心智模型
对大多数智能体工作来说,四个概念就足够了。next-token prediction:模型训练的是续写序列,而不是执行符号证明系统。tokenization and embeddings:模型处理的是经过分词并映射到向量空间的输入,而不是原始的人类可读文本。transformer attention:模型在生成下一步时决定输入的哪些部分重要。pretraining plus adaptation:广泛能力来自大规模预训练,而任务表现很大程度上取决于提示词、上下文、工具,以及后续的对齐或调优。
架构图
工具生态
对智能体最重要的模型属性是实践属性:- 指令遵循
- 长上下文处理
- 结构化输出可靠性
- 工具调用格式
- 总结与综合质量
取舍
- 更大的模型可能推理更好,但会提高成本和延迟。
- 更长的上下文窗口会降低一部分检索压力,但不会消除上下文工程的需求。
- 更强的指令遵循有助于工具使用,但不能保证事实正确。
- 预训练先验很广,但它不等于当前的、有来源支撑的知识。
- 把模型视为灵活的规划器和语言引擎
- 对精确数据、计算和系统动作使用外部工具
- 围绕上下文限制设计,而不是假装它们不存在
延伸阅读
更新日志
- 2026-04-21:基于导入的参考材料和实验室重写规则,完成初始的仓库原生草稿。
