下一代 Agent 架构，不要只看概念

很多文章聊下一代 Agent，喜欢讲“自主”“多模态”“持续学习”。这些词都没错，但如果只停在概念层，读完很容易觉得很热闹，却不知道明天该改哪一行代码。

我更愿意换个问法：下一代 Agent 到底比现在的 Agent 多了什么能力？这些能力什么时候值得做，什么时候只是增加复杂度？

本文要点

现在很多 Agent 还是“你说一句，我做一步”。用户给任务，它读文件、跑命令、调用工具，然后把结果返回。这已经很有用，但它仍然依赖用户不断推进。

下一代 Agent 的变化，不是突然拥有魔法，而是多了几个工程能力：

这听起来像智能升级，其实更像系统工程升级。Agent 越主动，越需要边界；Agent 越能调用工具，越需要权限控制；Agent 越能长期运行，越需要监控和回滚。

第一类值得做的是主动发现问题。

比如一个代码助手，不一定要等你说“帮我检查”。它可以在 PR 打开后自动看构建状态、测试失败、变更文件和历史风险，然后提醒你：“这个 PR 改了支付回调，但没有补幂等测试。”这不是炫技，它直接减少漏检。

第二类是长任务规划。

短任务靠一次提示就够了。长任务不行。比如“把旧的订单模块迁到新接口”，中间会遇到类型错误、测试失败、接口字段缺失、文档不一致。Agent 需要维护任务清单，知道哪些做完了，哪些还卡着。

第三类是可靠的工具使用。

一个 Agent 如果只能聊天，价值有限。它必须能读代码、跑测试、查日志、打开页面、提交变更。但工具越多，风险越高，所以每个工具都要有权限范围、超时、错误处理和审计日志。

第四类是可评估的记忆。

记忆不是“什么都记住”。真正有用的记忆应该回答三个问题：

如果答不上来，宁愿不要自动使用。

有些升级听起来很先进，但落地价值不一定高。

把所有输入都做成多模态，不一定有必要。如果你的业务主要处理文本工单，强行接入图片、语音、视频，只会增加解析、存储和审核成本。多模态适合质检、设计、客服截图、设备巡检这类场景，不适合所有场景。

让 Agent 完全自主执行，也很危险。只要涉及发布、删除、扣费、权限变更、用户通知，就必须有人类确认或强规则兜底。自主不是没有刹车，而是刹车设计得更清楚。

持续学习也不能简单理解成“用户反馈越多越好”。错误反馈、低质量反馈、恶意反馈都会污染系统。学习之前要先做数据筛选、版本隔离和灰度验证。

下面这张图可以作为落地前的自检。

一个团队适不适合做下一代 Agent，不看口号，看五个条件。

第一，数据是否干净。Agent 需要读取文档、日志、工单、代码、知识库。如果这些资料过期、重复、冲突，Agent 只会更快地产生错误结论。

第二，工具是否可控。每个工具都要知道能做什么、不能做什么、失败后怎么返回。不要把“执行任意命令”当成万能能力。

第三，权限是否分级。读文件、写文件、发消息、删数据、上线发布，不应该是同一档权限。越危险的动作，确认越严格。

第四，结果是否能评估。没有评估指标，就不知道 Agent 是变好了还是只是更会说。至少要跟踪成功率、人工接管率、失败原因和用户修正次数。

第五，失败是否能兜底。Agent 一定会失败。关键是失败后能不能停住、回滚、降级或把问题交还给人。

我不建议一开始就做“全自主 Agent”。更稳的路线是四步。

第一步，先做可观察 Agent。让系统记录每次任务的输入、计划、工具调用、结果和错误。没有观察，就没有改进。

第二步，做半自动 Agent。让 Agent 给方案、跑低风险检查、生成建议，但高风险动作由人确认。

第三步，做规则内自动化。把低风险、流程稳定、失败可回滚的任务交给 Agent 自动执行，比如整理报告、补文档、跑只读诊断。

第四步，才考虑目标驱动 Agent。用户只给目标，Agent 自己规划路径。但这个阶段必须有预算限制、权限边界、监控告警和人工接管。

下一代 Agent 架构的关键不是“看起来更智能”，而是能不能在真实系统里更稳定地完成任务。

如果你的数据还乱、工具还不可控、权限还没有分级、失败还不能回滚，那就先别急着追“自主 Agent”。先把底座补齐，再一点点放开自主性。真正有价值的 Agent，不是最会讲概念的那个，而是出问题时知道怎么停下来的那个。