智能体是什么 - Agent Systems Handbook by Prompthon

需要帮助？

摘要

智能体是一种以目标为导向的系统，能够持续感知环境、做出决策，并采取行动以实现期望结果。它不是一个静态模型，而是作为一个持续运行的循环工作：在动态周期中观察、推理和行动，并适应变化的条件。本节会帮助你理解智能体与独立模型的区别，理解这种感知-决策-行动循环如何构成智能行为的核心，以及这类系统如何在真实场景中被设计和应用。

为什么这很重要

传统程序和独立模型天然受限：它们执行预定义逻辑，或产生一次性输出，却无法长期适应、保持状态或追求目标。智能体之所以重要，是因为它们把静态计算转变为持续的、以目标为驱动的行为。自主性减少了对持续人工干预的需求，让系统可以在动态环境中独立运行。工具使用把能力扩展到单个模型之外，使系统能够与外部系统、数据源和现实动作交互。最重要的是，智能体的循环本质，即持续观察、推理和行动，使它能够处理无法通过单次响应解决的复杂多步骤任务。本质上，智能体代表了一种从“执行”到“行为”的转变：从只响应一次的系统，走向能够行动、适应并随时间改进的系统。理解这种转变，是构建实用、可扩展并能贴合现实复杂性的智能系统的关键。

心智模型

智能体的核心是一个闭环决策系统，而不是一次性计算。智能体不是简单的线性流水线，而是通过持续循环运行： Observe → Think → Act → Reflect → Loop

Observe：智能体通过用户查询、传感器数据或外部信号等输入感知环境。
Think：它使用模型（例如 LLM）、规则或规划策略，对观察到的信息进行推理，并决定下一步做什么。
Act：智能体执行动作，例如调用工具、生成输出或与环境交互。
Reflect：它评估行动结果，把反馈、错误或新信息纳入后续行为调整。

这个循环随后重复，形成一个自我修正且自适应的循环。关键在于，智能体并不是由某一次决策或响应定义的，而是由这个持续过程定义的。它的智能来自随着时间迭代改进行动的能力。换句话说，智能体从根本上是一个持续运行的闭环系统，而不是一次函数调用。

示例：每日新闻观察者

设想一个用于生成新闻摘要的每日新闻观察者智能体：

Observe：智能体接收请求（例如“总结最新 AI 新闻”），并从一组来源抓取文章。
Think：它决定哪些文章相关，按主题筛选，并决定如何组织内容。
Act：它检索、解析并总结选中的文章，形成结构化报告。
Reflect：它评估结果是否完整且连贯，并在必要时调整。

这个过程形成一个循环，让智能体能够根据中间结果持续优化输出。

这与传统脚本有何不同

虽然这个工作流看起来可能类似脚本化流水线，但智能体的行为有根本不同：

动态决策 传统脚本遵循固定步骤序列。智能体会根据中间结果决定每一步做什么（例如保留哪些文章、如何总结它们）。
上下文感知推理 脚本依赖预定义规则。智能体解释输入（例如“最新 AI 新闻”），并据此调整行为。
灵活控制流 脚本的控制流是静态的。智能体可以根据结果循环、修正或分支（例如结果不足时重新抓取或重新总结）。
语言智能集成 脚本以确定性方式处理结构化数据。智能体使用模型处理文本等非结构化数据，从而支持总结、筛选和推理。

架构图

工具生态

现代智能体不是作为单一模型构建的，而是把推理、行动和记忆组合为一个整体的多组件系统。这种模块化设计让智能体能够超越简单响应，处理复杂的真实任务。

LLM（推理核心）：通过解释输入并生成计划来决定要做什么。
工具（行动层）：通过与外部系统交互并执行动作来扩展能力。
记忆（上下文层）：提供跨步骤连续性，支持上下文保留和适应。
框架（编排层）：把组件组织和协调为可运行的系统（例如 LangChain、AutoGen）。

一个有用的心智模型是：把 LLM 看作“大脑”，把工具看作“四肢”。延伸这个类比，后端系统就像神经系统：它并不执行生物意义上的信号传递，而是解析模型输出，将其映射为结构化函数调用，并通过程序逻辑路由来触发工具执行。正是这一层完成了从决策到行动的转变，把抽象推理转化为具体操作。本质上，现代智能体不只是一个模型，而是一个协调起来的组件系统。智能来自推理、工具、记忆和控制逻辑之间的交互。

取舍

虽然智能体释放了强大能力，但这些特性也带来重要取舍。

循环成本（延迟 / token / 复杂度）：持续的观察-思考-行动循环会引入额外延迟和更高 token 使用量。多步骤推理、重试和反思会增加系统复杂度，让性能优化和成本控制更具挑战。
自主性风险（错误或非预期行动）：更高自主性意味着智能体可以在没有持续人工监督的情况下行动，但这也会引入错误决策、不安全动作或误解目标的风险，尤其是在开放环境中。
工具依赖（系统可靠性）：智能体依赖外部工具和 API 来行动。这些依赖的失败，例如 API 错误、延迟尖峰或不一致输出，会直接影响智能体行为和整体系统稳定性。

本质上，让智能体强大的同一组属性，即循环、自主性和工具使用，也会引入必须在真实系统中谨慎管理的成本、风险和工程挑战。

引用

Wooldridge, M., & Jennings, N. R. (1995). Intelligent Agents: Theory and Practice
Xi, Z., Chen, W., Guo, X., et al. (2023). The Rise and Potential of Large Language Model Based Agents

更新日志

2026-04-20：初始脚手架。
2026-05-04：完成核心内容，包括定义、心智模型、工具生态、取舍、示例和引用。

​摘要

​为什么这很重要

​心智模型

​示例：每日新闻观察者

​这与传统脚本有何不同

​架构图

​工具生态

​取舍

​引用

​延伸阅读

​更新日志

摘要