AI Agent智能体/代理主流框架/智能代理的未来与挑战!

为了记录学习过程,最近需要写笔记。先看一组数据:

其他条件都相同,且在zero shot的情况下,GPT-3.5的正确率为48.1%,GPT-4的表现更好,达到67.0%。

然而,加入了Agentic Workflow智能体工作流程之后,GPT-3.5的正确率直接飙到了95.1%,——Agent工作流效果显著,而且GPT-3.5比GPT-4得到的提升更加可观。

PS:Zero-shot模式是机器学习和人工智能中的一个概念,指的是模型在没有接受特定任务训练的情况下,直接对新任务进行推理和执行的能力。

那么AI Agent是什么呢?有什么组成?

AI Agent结构是Agentic Workflow-智能体工作流,是一种利用人工智能代理(AI Agents)来执行任务的迭代和多步骤方法。能让Zero-shot表现优秀,这就要求模型需要具备很强的泛化能力,这通常需要在大规模的数据集上进行训练,才能让模型获得广泛的知识和理解能力,同时也要求通过自然语言来定义任务时更加的明确清晰,通过模型的in-context-learning触发更好的任务表现能力。

那么其有什么组成呢:

Agentic Workflow-智能体工作流由四个部分组成,其中包含

Reflection(反思):让 Agent 审视和修正自己生成的输出,并提出改进的方法。

Tool Use(工具):LLM 利用Web搜索、代码执行或任何其他功能的工具,来帮助自己收集信息、采取行动或处理数据。

Planning(规划):让 Agent 分解复杂任务并按计划执行。比如一篇论文,首先写大纲,然后搜索和研究各部分内容,再写草稿)。

Multiagent Collaboration(多智能体协同):多个 Agent 扮演不同角色合作完成任务,分工合作,提出比单个智能体更好的解决方案。

关于Reflection(反思),我们可以这么理解“我们给一些反馈和较正,就比如我们让大模型写一段代码,然后将它输出的代码片段再输入回去,让大模型仔细检查代码的准确性和结构规范性,并给出评论。”

关于Tool Use(工具),可以这么理解“LLM可以调用给定的函数来利用一些工具收集信息、采取行动或操作数据”

关于Planning(规划),一种允许AI代理动态决定采取哪些步骤的能力,特别是在那些无法提前指定任务分解为一系列步骤的复杂任务中。这种能力使得AI代理能够自主地决定以未被预期的方式执行任务。简单来说就是使用大语言模型LLM将目标任务分解为更小的子任务,然后自主决定执行的步骤。

关于Multiagent Collaboration(多智能体协同),你可以让一个大语言模型扮演不同的角色,比如让一个 Agent 扮演公司 CEO、产品经理、设计师、代码工程师或测试人员,这些 Agent 会相互协作,根据需求共同开发一个应用或者复杂程序。

AI的能力会通过代理工作流程(agentic workflows)得到显著扩展

我们需要习惯于将任务委托给AI代理,并耐心等待响应。

快速生成token是重要的。即使是质量较低的语言模型,生成更多token也可以产生好的结果。

如果期待使用GPT-5/Claude 4/Gemini 2.0等先进的大型语言模型,可能需要在早期的模型上利用代理式推理(agentic reasoning)来获得良好的性能。

吴恩达演讲原视频:https://www.youtube.com/watch?v=sal78ACtGTc

欢迎大家讨论

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值