吴恩达:提升AI Agent能力的四种设计模式

吴恩达在3月份发博文 ,其中提到后续将介绍四种设计模式提升LLM应用能力:

  • 反思 Reflection:大型语言模型(LLM)检查自己的工作,以提出改进的方法。

  • 工具使用 Tool Use:LLM被赋予了工具,如网络搜索、代码执行或任何其他功能,以帮助它收集信息、采取行动或处理数据。

  • 规划 Planning:LLM提出并执行一个多步骤计划来实现目标(例如,为文章撰写大纲,然后进行在线研究,接着撰写草稿,等等)。

  • 多代理协作 Multi-agent collaboration:多个AI代理共同工作,分配任务并讨论辩论想法,以提出比单个代理更好的解决方案。

四月份,他已一一发文(原文链接见文末),介绍他对这种四种设计模式的观点,对每种模式都给出了多篇相关的参考论文,并且认为在当下的大模型能力下 ReflectionTool Use相对可靠,而PlanningMulti-agent collaboration 的输出质量相对难以控制,对这些模式想快速上手实践。

一、反思 Reflection

大型语言模型可以通过反思自己的行为成为更有效的智能体。

我们可以使用多智能体框架实现 Reflection。创建两个不同的智能体很方便,一个提示生成良好的输出,另一个提示对第一个智能体的输出提出建设性的批评。由此产生的两个代理之间的讨论导致了改进的响应。

二、工具使用Tool Use

大型语言模型如何通过利用外部工具进行搜索、代码执行、生产力、无穷无尽地充当代理。

在Agent工作流中,开发人员正在使用大模型的Function Call能力来搜索不同的来源(Web、Wikipedia、arXiv 等)、与生产力工具交互(发送电子邮件、读/写日历条目等)、生成或解释图像等等。我们可以使用上下文来提示 LLM,该上下文提供了许多函数的详细说明。这些描述可能包括函数所执行操作的文本说明,以及函数所需的参数的详细信息。我们希望 LLM 能够自动选择正确的函数来调用来完成工作。此外,正在构建LLM可以访问数百种工具的系统。在此类设置中,可能有太多函数可供使用,无法将所有函数都放入 LLM 上下文中,因此您可以使用启发式方法在当前处理步骤中选择要包含在 LLM 上下文中的最相关子集。

三、规划 Planning

大型语言模型可以驱动强大的Agent执行复杂的任务,前提是您要求他们在行动之前规划步骤。

规划是一种关键的Agent AI 设计模式,在这种模式中,我们使用大型语言模型 (LLM) 来自主决定执行哪些步骤来完成更大的任务。例如,如果我们要求Agent对给定主题进行在线研究,我们可能会使用 LLM 将目标分解为更小的子任务,例如研究特定的子主题、综合发现和编写报告。

许多任务无法通过单个步骤或单个工具调用完成,但Agent可以决定要执行哪些步骤。

诚然,许多Agent工作流不需要规划。例如,您可以让Agent以固定次数反映并改进其输出。在这种情况下,Agent采取的步骤顺序是固定的和确定的。但是,对于无法提前指定将任务分解为一组步骤的复杂任务,规划允许Agent动态决定要执行的步骤。

一方面,Planning是一种非常强大的能力;另一方面,它会导致难以预测的结果。根据我的经验,虽然我可以让 Reflection 和 Tool Use 的Agent设计模式可靠地工作并提高我的应用程序的性能,但 Planning 是一项不太成熟的技术,我发现很难提前预测它会做什么。但该领域继续快速发展,我相信规划能力会迅速提高。

四、多代理协同Multi-agent collaboration

促使 LLM 在复杂任务的不同部分扮演不同的角色会召唤一个可以更有效地完成工作的 AI Agent团队

多智能体协作是我在最近的信件中描述的四种关键 AI 智能体设计模式中的最后一种。对于像编写软件这样的复杂任务,多智能体方法会将任务分解为由不同角色(如软件工程师、产品经理、设计师、QA(质量保证)工程师等)执行的子任务,并让不同的智能体完成不同的子任务。

通过提示一个 LLM(或者,如果您愿意,也可以提示多个 LLM)执行不同的任务,可以构建不同的代理。例如,要构建一个软件工程师代理,我们可能会提示 LLM:“你是编写清晰、高效代码的专家。编写代码来执行任务…”

尽管我们对同一个 LLM 进行了多次调用,但我们应用了使用多个代理的编程抽象,这似乎有悖常理。我想提供几个原因:

  • 它有效!许多团队都用这种方法取得了不错的成绩,没有什么能比得上结果了!此外,消融研究(例如,在下面引用的 AutoGen 论文中)表明,多种药物比单一药物具有更好的性能。

  • 尽管今天的一些 LLM 可以接受非常长的输入上下文(例如,Gemini 1.5 Pro 接受 100 万个令牌),但它们真正理解长而复杂的输入的能力参差不齐。在代理工作流中,提示 LLM 一次专注于一件事可以提供更好的性能。通过告诉它什么时候应该扮演软件工程师,我们还可以指定该角色的子任务中什么是重要的。例如,上面的提示强调清晰、高效的代码,而不是可扩展和高度安全的代码。通过将整体任务分解为子任务,我们可以更好地优化子任务。

  • 也许最重要的是,多智能体设计模式为我们提供了一个框架,作为开发人员,可以将复杂任务分解为子任务。在编写代码以在单个 CPU 上运行时,我们经常将程序分解为不同的进程或线程。这是一个有用的抽象,它允许我们将任务(如实现 Web 浏览器)分解为更易于编码的子任务。我发现通过多智能体角色进行思考也是一个有用的抽象概念。

开源的AutoGen、Crew AI 和 LangGraph 等新兴框架提供了丰富的方法来构建问题的多智能体解决方案。

就像 Planning 的设计模式一样,多智能体协作的输出质量很难预测,尤其是在允许智能体自由交互并为他们提供多种工具时。更成熟的反思reflection和工具使用Tool Use模式更可靠。

附录:原文链接

www.deeplearning.ai/the-batch/how-agents-can-improve-llm-performance

www.deeplearning.ai/the-batch/agentic-design-patterns-part-2-reflection

www.deeplearning.ai/the-batch/agentic-design-patterns-part-3-tool-use

www.deeplearning.ai/the-batch/agentic-design-patterns-part-4-planning

www.deeplearning.ai/the-batch/agentic-design-patterns-part-5-multi-agent-collaboration

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值