AI智能体技术突破：引领科技新浪潮_生成式ai agent 技术突破-CSDN博客

本文链接：https://blog.csdn.net/weixin_42081445/article/details/137814834

AI智能体技术突破：引领科技新浪潮

在这里插入图片描述

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法，主要包括以下 3点：基于大模型的 AI Agent 工作流、AI Agent 工作流效果、AI Agent 的四种设计模式。

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势，我认为每个 AI 从业者都应该关注这个趋势。

目前，我们使用大语言模型的主要方式是一种非智能体工作流程，即您输入一个提示词，大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章，而不允许使用退格键，尽管这样做很难，但大模型的表现出奇地出色。

相比之下，AI Agent 智能体工作流程看起来是这样的（如下图右边所示）：一个 AI 大模型，我们让它写一份论文大纲。需要上网查资料吗？如果需要，就联网。然后写初稿、读初稿，并思考哪些部分需要修改。继续修改初稿并推进。
在这里插入图片描述
很多人没有意识到，这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶，它们工作得如此之好。

总之，这种有迭代反思的做法会带来显著的改进效果。

基于大模型的 AI Agent 工作流效果

比如：给定一个非空整数列表，返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段（如下图所示）：

在这里插入图片描述

事实证明，如果你使用 GPT-3.5，在零样本提示的条件下，GPT-3.5 的准确率是 48%。GPT-4 要好得多，达到了 67%。但如果你采用的是 AI Agent 智能体工作流，并将其打包，GPT-3.5 实际上能表现更好，甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流，GPT-4 也能表现得很好。注意，处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号。

在这里插入图片描述
解释一下上图：Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式，后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯，毕竟对于一段复杂的程序，没有一个程序员是从头写到尾的，一般都是先能跑通，然后不断优化重构，补充异常处理，持续迭代优化的过程。

AI Agent 的四种设计模式

Reflection 反思设计模式

很好理解，如果你让大模型写一段代码，它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去，让大模型仔细检查它写的代码的准确性、结构规范性等，并且给出评论。

然后再将这些反馈结果输入给大模型，它可能会输出一个比第一版更好的代码。

在这里插入图片描述
我之前描述的是一个单一的编码 AI Agent 智能体，你提示它与自己进行交互。这个想法的一种自然延伸是，不是单一的代码 AI Agent 智能体，而是有两个AI Agent 智能体，一个是编码 AI Agent 智能体，另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型，但你以不同的方式对它们进行提示，对一个说“你是专业编码者，编写代码”，对另一个说"你是专业代码评审员，评审这段代码"。这种工作流程实际上非常容易实现，我认为它是一种通用技术，可以为很多工作流程带来显著的大语言模型性能提升。