作为高度颠覆性的生成式人工智能 (GenAI) 技术的技术支柱,基础模型 (FMs) 已获得了学术界和工业界的广泛关注。特别是,大型语言模型 (LLMs) 的出现,它们在理解和生成类人推理和内容方面表现出色,催生了大量使用语言模型的各种下游任务。随后,基于 FM 的自主Agent的开发越来越受到关注,例如 AutoGPT 和 BabyAGI,它们可以主动、自主地追求用户目标。
尽管当前研究者在AI Agent领域投入了巨大努力,但从业者在构建和实施基于基础模型(Foundational Model,FM)的Agent方面面临着陡峭的学习曲线,并且,Agent的架构设计和架构模式的集合尚未得到系统的探索和制定。
在软件工程中,架构模式是软件设计中常见问题的一个可重用的解决方案。这里说的智能体/Agent,是指能够发挥主动作用或产生影响以实现用户目标的 AI系统,一个用于设计基于FM的Agent的架构模式目录。
Agent设计模式全景图:
当用户与 Agent 交互时,【被动目标创建者和主动目标创建者】可以帮助理解用户的意图和环境信息,并在上下文工程中将最终目标进行规范化,而【提示/响应优化器】则根据预定义的模板,对其他 agent/tools 的提示或说明进行优化,以满足特定的格式或内容要求。
给定用户的输入,Agent 通过【检索增强生成】从知识库中获取额外的上下文信息。然后,它通过【单路径计划生成器和多路径计划生成器】构建计划,将最终目标分解为可执行的任务。在这个过程中,可能会进行【单次模型查询和增量模型查询】。
生成的计划应该进行审查,以确保其准确性、可用性、完整性等。【自我反思、交叉反思和人类反思】可以帮助 Agent 从不同的反思实体那里收集反馈,并根据反馈相应地完善计划和解题步骤。
之后,Agent 可以将任务分配给其他基于窄 AI 或非 AI 的系统,调用外部工具,并通过【工具/agent 注册表】使用一组 Agent 来实现目标。特别是,Agent 可以在同一任务上工作,并通过【基于投票、基于角色或基于辩论的合作】来最终确定结果。
例如,Agent 可以扮演不同的角色,如协调器和工作者。【代理适配器】不断学习不同工具的接口,并将它们转换为 FM 友好的环境。【多模态护栏】可以用于管理和控制基础模型的输入/输出。同时,使用的 Agent 将执行各自的推理、计划和执行过程,这可能需要通过【检索增强生成、工具/agent 注册表和代理适配器】访问外部系统。
最后,我们声称开发者可以通过【代理评估器】在设计时和运行时评估 Agent 的性能。
图:用UML序列图表示的Agent设计模式全景图
图:Agent设计模式之间的连接关系
AI Agent 常见的九种设计模式📖。
.
ReAct 模式原理:将 Reasoning 和 Act 结合,执行行动后有 Observation,维持短期记忆。比如找胡椒粉,会根据每步观察决定下一步行动🧂。
.
实现:生成提示词,大模型生成 Thought + Action,调用外部工具,生成 Observation,循环至 Action 为 Finish,输出结果。
.
Plan and solve 模式:先计划再执行,适合复杂任务,如炒菜🍳,计划会根据情况变化。
.
LLM Compiler 模式:并行 Function calling 提高效率,像计算年龄差可同时搜索。
.
Basic Reflection 模式:类似师生互动,Generator 写作业,Reflector 批改。
.
Self - Discover 模式:对 task 本身反思,选择合适方式重新推理。
.
REWOO 模式:隐式嵌入 Observation,如审批流,各步骤相互依赖。
.
Language Agent Tree Search 模式:融合多种方式,通过树搜索强化学习。
.
Reflexion 模式:升级版,引入外部数据评估,更具建设性。
.
Storm 模式:先生成大纲再丰富内容,可创作文章📃
1. 被动模式与主动模式
这部分介绍目标创建的被动与主动模式,在被动模式下,智能体对用户“言听计从”,不自作主张;在主动模式下,智能体除了遵从用户指令外,会利用工具捕捉一些上下文信息,做一些“举一反三”的工作,类似于一些大模型产品提供的“指令润色”功能。
2. 提示词工程与RAG
接下来是业界广泛提到的提示词工程与RAG,已经成为大模型工程的标配技术。
3. 模型查询
对于简单的问题,智能体只需一次访问FM,即可得到答案。碰到复杂问题,智能体需要多次访问FM,通过多轮迭代逐步逼近答案。
4. 计划生成
5. 反思机制
生成的计划应该进行审查,以确保其准确性、可用性、完整性等。【自我反思、交叉反思和人类反思】可以帮助 Agent 从不同的反思实体那里收集反馈,并根据反馈相应地完善计划和解题步骤。
6. 多Agent合作
7. 其他技术
AI 智能体的设计模式是构建高效、灵活且适应性强的智能系统的关键。根据最新的研究和实践总结,以下是一些常见的 AI 智能体设计模式:
1.反思(Reflection)模式
反思模式是一种让 AI 模型通过自我评估和迭代优化来提高任务执行能力的方法。模型在生成初始解决方案后,会检查输出结果,发现改进点并进行优化。
2.工具使用(Tool Use)模式
该模式允许 AI 智能体通过调用外部工具(如搜索引擎、代码执行平台等)来扩展自身能力。通过整合外部工具,AI 系统能够在特定任务上达到更高的效率和准确性。
3.规划(Planning)模式
规划模式将复杂任务分解为多个有序步骤,并逐一执行这些步骤以达成目标。这种模式通过任务分解提高了执行的准确性和灵活性,适合处理复杂的、多步骤的任务。
4.多智能体协作(Multi-agent Collaboration)模式
在这种模式下,多个智能体通过分工协作来共同完成复杂任务。智能体之间可以共享信息、协调行动,从而提高任务执行的效率和准确性。
5.链式工作流(Chain Workflow)模式
链式工作流将多个任务按线性序列组织,一个步骤的输出作为下一个步骤的输入。这种模式适用于任务具有明确顺序且每个步骤依赖于前一步输出的场景。
6.路由工作流(Routing Workflow)模式
路由工作流根据输入条件动态选择执行路径,将任务路由到不同的处理流程。这种模式适合任务输入复杂且不同输入需要专门处理的场景。
7.编排器-工作者(Orchestrator-Worker)模式
在这种模式下,中央 AI(编排器)负责将任务分配给专门的子进程(工作者),每个工作者负责不同的功能。这种模式通过并行处理提高了效率和专业化程度。
8.评估器-优化器(Evaluator-Optimizer)模式
该模式通过迭代评估和优化来不断改进任务处理效果。评估器负责评估智能体输出的质量,优化器则根据反馈进行改进。
9.并行化工作流(Parallel Workflow)模式
并行化工作流通过同时执行多个任务或处理多个数据集来提高效率,适合处理大量独立数据或多个请求的场景。
写在最后,这些设计模式各有优势和适用场景,开发者可以根据具体任务需求选择合适的设计模式来构建高效的 AI 智能体系统。
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
大模型&AI产品经理如何学习
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
1.学习路线图
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓