AI智能体技术突破:引领科技新浪潮

在这里插入图片描述

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法,主要包括以下 3点:基于大模型的 AI Agent 工作流、AI Agent 工作流效果、AI Agent 的四种设计模式。

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势,我认为每个 AI 从业者都应该关注这个趋势。

目前,我们使用大语言模型的主要方式是一种非智能体工作流程,即您输入一个提示词,大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章,而不允许使用退格键,尽管这样做很难,但大模型的表现出奇地出色。

相比之下,AI Agent 智能体工作流程看起来是这样的(如下图右边所示):一个 AI 大模型,我们让它写一份论文大纲。需要上网查资料吗?如果需要,就联网。然后写初稿、读初稿,并思考哪些部分需要修改。继续修改初稿并推进。
在这里插入图片描述
很多人没有意识到,这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶,它们工作得如此之好。

总之,这种有迭代反思的做法会带来显著的改进效果。

基于大模型的 AI Agent 工作流效果

比如:给定一个非空整数列表,返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段(如下图所示):

在这里插入图片描述

事实证明,如果你使用 GPT-3.5,在零样本提示的条件下,GPT-3.5 的准确率是 48%。GPT-4 要好得多,达到了 67%。但如果你采用的是 AI Agent 智能体工作流,并将其打包,GPT-3.5 实际上能表现更好,甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流,GPT-4 也能表现得很好。注意,处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号

在这里插入图片描述
解释一下上图:Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式,后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯,毕竟对于一段复杂的程序,没有一个程序员是从头写到尾的,一般都是先能跑通,然后不断优化重构,补充异常处理,持续迭代优化的过程。

AI Agent 的四种设计模式

Reflection 反思设计模式

很好理解,如果你让大模型写一段代码,它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去,让大模型仔细检查它写的代码的准确性、结构规范性等,并且给出评论。

然后再将这些反馈结果输入给大模型,它可能会输出一个比第一版更好的代码。

在这里插入图片描述
我之前描述的是一个单一的编码 AI Agent 智能体 ,你提示它与自己进行交互。这个想法的一种自然延伸是,不是单一的代码 AI Agent 智能体 ,而是有两个AI Agent 智能体,一个是编码 AI Agent 智能体 ,另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型,但你以不同的方式对它们进行提示,对一个说“你是专业编码者,编写代码”,对另一个说"你是专业代码评审员,评审这段代码"。这种工作流程实际上非常容易实现,我认为它是一种通用技术,可以为很多工作流程带来显著的大语言模型性能提升。

Tool use 工具使用设计模式

相信大家使用 Copliot,或者月之暗面的 Kimi Chat,你给出 Prompt 提示词,它首先会检索互联网上的内容,基于检索到的内容进行总结分析,给出结论。

这个其实就是大模型使用「网页搜索」工具的例子。

再比如:你问大模型,今天的天气如何?这个时候大模型会调用天气预报工具得到今天的的天气状况。

在这里插入图片描述

Planning 规划设计模式

在我进行的一些现场演示中,有些演示会失败,AI Agent 智能体会重新规划路径。我经历过很多这样的时刻。其中一个例子是从 HuggingGPT 论文中改编的,输入的是:请生成一张图片,一个女孩在看书,她的姿态和图像中的男孩一样,再使用你的声音描述这张新图片。

在这里插入图片描述
今天有了 AI Agent 智能体,你可以确定第一件要做的事是确定男孩的姿态,提取姿态。接下来需要找到一个姿态图像模型,遵循指令生成一张女孩的图像。然后使用图像 - 文本模型得到描述。最后使用文本转语音模型读出描述。

Multiagent collaboration 多智能体协作设计模式

多智能体协作,这部分很很有趣,比你想象的好很多,类似于之前大火的 AI 斯坦福小镇。
在这里插入图片描述
吴恩达举的例子是开源项目 ChatDev,你可以让一个大模型扮演不同的角色,比如:公司CEO、设计师、产品经理或测试人员,这些 Agents 会相互协作,共同开发一个 App 或者复杂程序。

虽然不是每次都能成功,但有时确实非常惊艳!

  • 84
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一名技术极客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值