智能体与多智能体协作
覆盖工具调用、记忆、规划、编排、蜂群协作和工作流自动化。
推荐阅读顺序
- 智能体与多智能体系统:规划、工具调用、记忆、协作与评测
研究聚焦智能体从单轮问答走向可执行任务时产生的系统问题:模型如何形成计划,如何调用工具,如何保存状态,多个智能体如何协作而不互相制造噪音。方法上,文章用“目标、状态、行动、观察、评测”的闭环解释单智能体,再用角色分工、协议边界和共享记忆分析多智能体。结论是,智能体不是角色扮演模板,而是带有执行权、状态迁移和验收机制的工程系统;多智能体的价值来自明确责任和可验证协作,而不是堆叠更多人格设定。
- 工具调用与函数调用:Schema设计、错误恢复、幂等性和安全边界
本文把工具调用和函数调用解释为一套受控执行系统,而不是模型输出 JSON 的技巧。Schema 设计、参数来源、错误恢复、幂等性、安全边界和提示注入防护共同决定模型能否从“会说”走向“会办事”。文章强调,模型只能提出调用意图,真正执行权必须保留在应用和业务系统中;高风险动作要拆分为可审计的工具、可验证的参数和可恢复的状态。工具调用的生产价值,不在工具数量多,而在模型、接口和权限之间形成清晰契约。
- Agent记忆系统:短期记忆、长期记忆、情景记忆、知识库和遗忘机制
本文讨论 Agent 记忆系统如何从聊天历史扩展为可治理的工作记忆、长期记忆、情景记忆、知识库和遗忘机制。记忆的目标不是无限保存,而是在长期协作中降低重复探索、保留稳定偏好、复用历史经验、引用外部事实并清除过期或敏感信息。文章强调,记忆必须带有作用域、来源、时间、置信度、权限和删除路径;否则记忆越强,错误污染和隐私风险越大。生产级 Agent 的记忆能力,本质上是选择、检索、压缩、验证和遗忘的组合。
- 多智能体编排:监督者、黑板、投票、辩论、流水线和蜂群协作
本文把多智能体编排视为任务分工、状态传递、证据合并和冲突处理的工程问题,而不是角色扮演。监督者、黑板、投票、辩论、流水线和蜂群协作分别适合不同任务结构:有的强调协调,有的强调共享工件,有的强调候选比较,有的强调批判性审查,有的强调稳定工序,有的强调大规模探索。文章的核心观点是,多智能体只有在责任边界、工具权限、中间工件和停止条件清楚时才可能提高质量;否则它只会增加成本、延迟和错误传播路径。
- AI工作流自动化:n8n、Dify、LangGraph、AutoGen、CrewAI和自研编排
本文把 AI 工作流自动化定义为可控智能执行系统,而不是把大模型接入自动化平台。n8n、Dify、LangGraph、AutoGen、CrewAI 和自研编排分别代表连接器优先、应用交付、有状态图、多智能体运行时、流程加团队和深度业务定制六种路线。文章强调,框架选择应由任务状态、外部系统、人工介入、失败恢复、权限审计和长期维护决定。AI 可以参与判断和生成,但业务系统必须保留状态、确认、回滚和最终执行权。
- AI浏览器和网页自动化:Playwright、Browser Use、Computer Use和安全沙箱
AI 浏览器和网页自动化把传统测试、运营自动化和智能体执行能力连接在一起,但风险也随之从“脚本失败”扩大到“代理做错真实动作”。Playwright 代表确定性、可验证和可纳入 CI 的浏览器控制;Browser Use 代表由模型决定下一步动作的网页代理;Computer Use 进一步扩展到视觉桌面控制。本文把三类能力放在同一套安全沙箱和行动后果模型中比较,强调工具选择、登录态隔离、域名白名单、凭证处理、高风险确认、审计证据和人工接
- AI开发者平台:SDK、API、插件、权限、示例和开发者生态
AI 开发者平台的本质不是模型接口集合,而是把模型、工具、数据、插件和治理能力转化为开发者可持续构建产品的契约系统。SDK、API、插件、权限、示例和生态并不是并列栏目,而是从首次调用到生产运营的一条路径:开发者需要稳定接口、清晰错误、可调试链路、可控权限、可复用示例和可治理扩展;管理员需要预算、审计、密钥、模型路由、数据边界和插件治理;生态开发者需要分发、反馈、收益和版本机制。本文主张用“开发者生产闭环”评估 AI 平台,而不是用模型