AI Agent 智能体,厉害了!

 ▼最近直播超级多,预约保你有收获

c42ab72f2bfedc2a4bdfd52bdaeb4043.png

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法,主要包括以下3点基于大模型的 AI Agent 工作流AI Agent 工作流效果AI Agent 的四种设计模式

f1c4e781e2bcb7230a17ff664ba05e05.png

 1

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势,我认为每个 AI 从业者都应该关注这个趋势。

目前,我们使用大语言模型的主要方式是一种非智能体工作流程,即您输入一个提示词,大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章,而不允许使用退格键,尽管这样做很难,但大模型的表现出奇地出色。

相比之下,AI Agent 智能体工作流程看起来是这样的(如下图右边所示):一个 AI 大模型,我们让它写一份论文大纲。需要上网查资料吗?如果需要,就联网。然后写初稿、读初稿,并思考哪些部分需要修改。继续修改初稿并推进。

aac06c6c8a31f783b7d39ed0c5ddc002.png

很多人没有意识到,这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶,它们工作得如此之好。

总之,这种有迭代反思的做法会带来显著的改进效果。

 2

基于大模型的 AI Agent 工作流效果

比如:给定一个非空整数列表,返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段(如下图所示):

3614e1e82562136ca657267b4075147e.png

事实证明,如果你使用 GPT-3.5,在零样本提示的条件下,GPT-3.5 的准确率是 48%。GPT-4 要好得多,达到了 67%。但如果你采用的是 AI Agent 智能体工作流,并将其打包,GPT-3.5 实际上能表现更好,甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流,GPT-4 也能表现得很好。注意,处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号。

3e0e807795d18296bfa9cb549ea4f542.png

解释一下上图:Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式,后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯,毕竟对于一段复杂的程序,没有一个程序员是从头写到尾的,一般都是先能跑通,然后不断优化重构,补充异常处理,持续迭代优化的过程。

 3

AI Agent 的四种设计模式

第一、Reflection 反思设计模式

很好理解,如果你让大模型写一段代码,它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去,让大模型仔细检查它写的代码的准确性、结构规范性等,并且给出评论。

然后再将这些反馈结果输入给大模型,它可能会输出一个比第一版更好的代码。

0eb134a1d6e584ceefe984add8ed3331.png

我之前描述的是一个单一的编码 AI Agent 智能体 ,你提示它与自己进行交互。这个想法的一种自然延伸是,不是单一的代码 AI Agent 智能体 ,而是有两个AI Agent 智能体,一个是编码 AI Agent 智能体 ,另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型,但你以不同的方式对它们进行提示,对一个说“你是专业编码者,编写代码”,对另一个说"你是专业代码评审员,评审这段代码"。这种工作流程实际上非常容易实现,我认为它是一种通用技术,可以为很多工作流程带来显著的大语言模型性能提升。

第二、Tool use 工具使用设计模式

相信大家使用 Copliot,或者月之暗面的 Kimi Chat,你给出 Prompt 提示词,它首先会检索互联网上的内容,基于检索到的内容进行总结分析,给出结论。

这个其实就是大模型使用「网页搜索」工具的例子。

再比如:你问大模型,今天的天气如何?这个时候大模型会调用天气预报工具得到今天的的天气状况。

d9b01ac6c74ef9afc5027286ea3cb5ce.png

第三、Planning 规划设计模式

在我进行的一些现场演示中,有些演示会失败,AI Agent 智能体会重新规划路径。我经历过很多这样的时刻。其中一个例子是从 HuggingGPT 论文中改编的,输入的是:请生成一张图片,一个女孩在看书,她的姿态和图像中的男孩一样,再使用你的声音描述这张新图片。

b99b5426c18a0ee4ffa6d4cca91737b6.png今天有了 AI Agent 智能体,你可以确定第一件要做的事是确定男孩的姿态,提取姿态。接下来需要找到一个姿态图像模型,遵循指令生成一张女孩的图像。然后使用图像 - 文本模型得到描述。最后使用文本转语音模型读出描述。

第四、Multiagent collaboration 多智能体协作设计模式

多智能体协作,这部分很很有趣,比你想象的好很多,类似于之前大火的 AI 斯坦福小镇。

ecb3f775a249913920333e32a63942e9.png

吴恩达举的例子是开源项目 ChatDev,你可以让一个大模型扮演不同的角色,比如:公司CEO、设计师、产品经理或测试人员,这些 Agents 会相互协作,共同开发一个 App 或者复杂程序。

虽然不是每次都能成功,但有时确实非常惊艳!

为了帮助同学们彻底掌握大模型的 AI Agent 智能体、知识库、向量数据库、 RAG、知识图谱的应用开发、部署、生产化,今晚20点我会开一场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 4

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

1bb3376b6f995e7b40505f0e83a24ad8.gif

0d1e1779e616182b3da71ea001b818ad.png

本期名额有限

高度起始于速度(手慢无!!)

 5

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

deb84900a8ae52f39ca4636a483ad6ee.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

33423ae10422cb7a2ccd58efa08e4e6a.png

第二步:扫码后,点击以下关注按钮,就可关注我。

729d94ebd1c550519f911c74f5b9355e.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

60d462e2096a32ae49b6351ca2fbdf62.jpeg

END

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
人工智能 Agent 入门是一个广泛的领域,涵盖了多个学科和技术。以下是一些建议,帮助你入门: 1. 学习机器学习基础:了解机器学习的基本概念和算法,包括监督学习、无监督学习和强化学习等。可以开始学习常见的机器学习算法,如线性回归、决策树和神经网络等。 2. 了解强化学习:强化学习是训练智能在环境中学习最优策略的方法。了解马尔可夫决策过程(MDP)和强化学习算法,如Q-learning和策略梯度等。可以通过阅读相关教材或在线课程进行学习。 3. 编程技能:掌握至少一种编程语言,如Python,它在人工智能领域应用广泛。熟悉常用的机器学习和深度学习库,如Scikit-learn和TensorFlow等。这将帮助你实现和调试机器学习模型。 4. 实践项目:通过实现一些简单的机器学习项目来加深理解和实践。选择一些开源数据集,如Iris花卉数据集或MNIST手写数字数据集,并使用机器学习算法对其进行分类或预测。 5. 扩展知识:了解更高级的深度学习模型和技术,如卷积神经网络(CNN)和循环神经网络(RNN)。探索自然语言处理(NLP)、计算机视觉(CV)和强化学习等领域的应用。 6. 持续学习:跟随最新的研究和发展,参与在线课程、论坛和研讨会。人工智能领域变化迅速,不断学习和更新知识是非常重要的。 这些是入门人工智能 Agent 的一些建议。希望对你有所帮助!如果有更多问题,请随时问我。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值