智能体工作流与设计模式解析

过去两年中基础模型快速发展,从大语言模型到多模态模型、再到推理模型,大模型的能力不断提升。基于大模型的智能体也在不断发展,智能体可以更好与业务场景结合,发挥出大模型的价值。本文探讨智能体工作流并分析智能体工作流的常见设计模式。

*01 为什么需要智能体工作流?*

目前大多数人都是直接使用大模型,即大模型根据提示生成最终输出,而且不做任何修改。这好比是要求人从头到尾直接写出一篇完整的文章,难度无疑是非常大的。但是根据人类作者的通常做法来看,写文章的过程是反复迭代优化,最终才能产出一篇文章。

根据人工智能学者、斯坦福大学教授吴恩达的研究发现,GPT-3.5零样本模式的输出正确率为48.1%,GPT-4零样本模式的输出正确率更高,达到了67.0%,然而其表现相差并不是很大。但是,通过引入迭代智能体工作流(采用反思模式),GPT-3.5的正确率就可以高达95.1%。

img

由此可见,相比直接使用大模型的方式,智能体工作流通过多次迭代,可以逐步构建出更高质量的输出。

*02 智能体工作流*

工作流(Workflow)是指为完成特定任务或目标所采取的一系列相互关联的步骤。工作流并不是新出现的,当前企业信息系统中就存在很多自动化工作流。这种传统的工作流是确定性的(Deterministic),即它们遵循预定义的步骤序列,业务规则也是预定义好的,每次都是重复执行。以自动化的报销审批工作流为例,如果费用标签为“餐饮”,且金额小于$30,则自动批准。

随着大模型到来,一些工作流会使用大型语言模型(LLMs)或其他机器学习模型来增强其能力,这些工作流通常被称为 AI 工作流。AI工作流又可分为**智能体型(Agentic)非智能体型(Non-Agentic)**两种。

**非智能体型工作流(Non-Agentic Workflow)**遵循预定义的工作步骤,只是在步骤中会调用大模型,大模型根据输入的指令产生输出。非智能体型工作流可预测性较强,适合于预定义的重复任务。可见非智能体型工作流本质上还是传统工作流,只是增加了大模型的直接调用。

**智能体型工作流(Agentic Workflow)**是为完成特定任务或目标由一个或多个智能体来动态执行一系列步骤。智能体型工作流更具动态性、自主性、适应性。大模型可以自主决定流程、选择工具并确定任务完成方式。

智能体型工作流可以使用智能体的推理能力、工具使用能力和持久记忆能力,来开展如下工作:

**1.制定计划(Make a plan)。**智能体型工作流从规划开始。LLM 负责任务分解(Task Decomposition),将复杂任务拆解为更小的子任务,并确定最佳执行路径。

**2.使用工具执行任务(Execute actions with tools)。**智能体型工作流使用一系列预定义工具(如 API、数据库、搜索引擎等),并配合相应的权限管理,以执行任务并实施规划方案。

**3.反思和迭代(Reflect and iterate)。**智能体可以在每个步骤评估结果,如有必要调整计划,并反复执行,直到得到满意的结果。

下图是三类工作流的示例:

图片

可以看到,传统非AI工作流执行预定义步骤和固定的业务规则,每次发生变化都需要调整工作流。非智能体型AI工作流使用了大模型,但不具备自主性和动态性。智能体型工作流可以使用智能体动态执行任务,具备自主性、动态性和适应性。

从适用的问题领域来看,传统非AI工作流和非智能体型AI工作流更适合步骤固定、规则明确的场景,智能体型AI工作流适合于需要动态决策或使用外部工具的场景。

*03 智能体型工作流设计模式*

设计模式是一种解决软件设计问题的通用解决方案,它提供了一种可重用的模版,可以帮助开发人员构建更健壮、可维护和可扩展的软件系统。

为更好开发智能体型工作流,总结了如下五类设计模式:

1. 链式工作流(Chain Workflow)模式

链式工作流将多个任务按线性序列组织,一个步骤的输出作为下一个步骤的输入。这种模式适用于任务具有明确顺序且每个步骤依赖于前一步输出的场景。

链式工作流将多个步骤按线性序列组织,一个步骤的输出作为下一个步骤的输入。它适用于具有明确顺序步骤的任务,每个步骤都基于上一步的输出,形成一个连续的处理链条,逐步提升任务处理的准确性。链式工作流模式对于任务的控制非常强,且具备一定的适应性。

例如,在新闻推荐系统中,工作流可能首先检索用户偏好,然后将这些偏好作为输入来获取和分析新闻。这是一个典型的链式任务,其中用户偏好的输出直接作为新闻检索的输入。

在这里插入图片描述

适用场景:

任务具有明确的顺序步骤;

需要通过延迟换取更高的准确性;

每个步骤依赖于上一步的输出。

2.并行工作流(Parallel Workflow)模式

并行工作流通过同时执行多个任务或处理多个数据集来提高效率,适合处理大量独立数据或多个请求的场景,如大数据分析、实时监控和复杂决策支持系统。这种模式适用于可以独立并同时进行的任务,使得系统资源得到充分利用,从而减少总体处理时间。

例如,一个金融分析助手可能需要同时分析股票市场、外汇市场和商品市场的数据。通过将这些分析任务分配给不同的LLM调用(如LLM Call 1、LLM Call 2和LLM Call 3),每个调用可以并行处理其分配的市场数据。然后,一个聚合器组件将收集这些并行任务的结果,并整合成一个全面的分析报告。

在这里插入图片描述

适用场景:

处理大量相似但独立的项目;

需要多个独立视角的任务;

任务可并行化且对处理时间要求较高。

3.路由工作流(Routing Workflow)模式

路由工作流根据输入条件动态选择执行路径,将任务路由到不同的处理流程。这种模式适合任务输入复杂且不同输入需要专门处理的场景。这样,系统可以在没有预定义序列的情况下适应不同情况。在不同的处理流程中,可以使用不同的大模型来处理,并调用外部工具。

例如,一个金融服务平台可能根据用户感兴趣的主题( 如“crypto” 或“stocks” )将请求路由到不同的API端点。这是路由工作流的一个示例,其中输入的主题决定了请求的路由路径。

在这里插入图片描述

适用场景:

任务具有不同输入类别且复杂;

不同输入需要专门处理;

可以准确分类输入。

4.编排器-工作者(Orchestrator-Worker)模式/规划模式(Planning Pattern)

在这种模式下,中央 AI(编排器)负责将任务分解为多个子任务,并分配给专门的子进程(工作者智能体)来并行处理,每个工作者负责不同的功能(例如,数据检索、分析、摘要)。这种模式通过并行处理提高了效率和专业化程度。该模式下的任务分解使用了大模型的推理和规划能力。

例如,在新闻分析项目中,服务可以充当编排器,与AI模型协调新闻检索和分析。AI模型(如OpenAI的ChatModel)作为文本分析的专用工作者,负责处理特定的分析任务。

在这里插入图片描述

适用场景:

任务复杂且无法预先预测子任务;

需要不同方法或视角的任务;

需要适应性问题解决的情况。

**5.评估器-**优化器(Evaluator-Optimizer)模式/反思模式(Reflection Pattern)

该模式通过使用大模型进行迭代评估和优化来不断改进任务处理效果。评估器负责评估智能体输出的质量,优化器则根据反馈进行改进,从而随着时间推移提高准确性。

大模型反思有三种反思方式——自我反思、交叉反思和人类反思。自我反思是针对大模型输出受幻觉影响、缺乏可解释性的情况,智能体进行自我评估,反思并改进输出。交叉反思是针对大模型本身能力有限、缺乏可解释性的情况,在大模型之间进行相互反思。人类反思则是由用户或专家评估和提供反馈。

img

评估器-优化器模式使用的是交叉反思,大模型B对大模型A的输出进行反思。

例如,在新闻内容分析中,可以通过AI模型总结和分析新闻,这可以视为一种内容评估和改进的形式。AI模型不断评估新闻内容的质量,并根据评估结果优化分析策略。

另外一个例子是代码生成,通过大模型生成代码,然后在沙盒或执行环境中运行代码,获取出错信息并反馈给大模型,大模型会迭代优化代码直到成功运行。

img

适用场景:

存在明确的评估标准;

迭代优化可以提供可衡量的价值;

任务受益于多轮反馈和优化。

6. *工具使用模式(**Tool Use Pattern**)***

工具使用模式允许智能体通过调用外部工具(如搜索引擎、代码执行平台、向量数据库等)来扩展自身能力,从而做出在特定任务上达到更高的效率和准确性。

检索增强生成(RAG)是典型的工具使用模式,通过引入相关的、实时的外部向量数据库来增强大模型的响应准确性,有效解决了幻觉问题,而且提高了响应的专业性。

通过使用外部工具,智能体可以完成一系列任务,比如自动发送邮件、查询合适的机票并完成机票预订、通过网络搜索获得最新的信息等。比如最近火爆的通用智能体Manus就是通过集成使用29种外部工具,实现灵活调用工具并完成各类任务。

img

工具使用模式对于企业智能化改造非常关键。企业可以应用工具使用模式将现有的信息系统能力API化之后结合到智能体中,实现企业IT资产的有效利用。

需要实时数据支持或依赖外部资源的任务。

**7.多智能体协作(Multi-Agent Collaboration Pattern)**‌

多智能体协作模式重视多个智能体之间的协作。每个智能体被赋予特定角色,互相交流信息并协调行动,从而共同完成复杂任务。通过与其他智能体的交互和协作,可以提高整体的执行效率和解决问题的能力‌。虽然当前多智能体系统的应用仍在探索中,但像ChatDev这样的项目初步展现了这一模式的潜在能力。

多智能体协作必然要解决不同智能体之间有不同意见时如何达成一致的问题。有三种机制可以解决这个问题:投票机制、辩论机制以及角色机制。在投票机制中,智能体之间进行投票来达成共识,体现了公平性。在辩论机制中,智能体之间通过辩论来达成共识,体现了适应性和可解释性。在角色机制中,不同智能体分配不同的角色,由角色来负责具体的决策,体现了分工和容错性。

img

在软件研发场景中,为产品经理、架构师、项目经理、软件工程师、测试工程师等不同角色建立不同的智能体,当智能体之间有不同意见,需要决策时,由不同角色的智能体来进行具体的决策,比如和项目立项、进展和上线有关的由项目经理智能体决策,代码编写和bug修复相关的由软件工程师智能体决策。

适用场景:

任务复杂;

由不同技能、角色协同完成。

04 总结

与传统的非AI工作流相比,智能体型工作流擅长处理步骤和规则不太明确的任务,具有自主性、动态性和适应性。企业在设计智能体型工作流时,可以使用链式工作流模式、并行工作流模式、路由工作流模式、编排器-工作者模式和评估器-优化器模式、工具使用模式和多智能体协作模式等七类设计模式,提高设计的效率和系统的健壮性、可维护性和可扩展性。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值