LLM大模型到AIAgent:技术演进之路

▼最近直播超级多,
预约
保你有收获

近期直播:

基于 LLM 大模型的微调构建AI Agents 案例实践


1

LLM 大模型有哪些局限性?

给定一些字或者词(称为 token),预测下一个字或者词模型,就是语言模型。

大语言模型(Large Language Model, LLM)是一类基于深度学习的语言模型,它们在大量的文本数据上进行训练,可以完成各种任务,包括代码编写、总结、翻译等。LLM 的特点是规模庞大,包含数十亿的参数,学习语言数据中的复杂模式。

大语言模型发展日新月异,基于 Transformer 预训练架构演变成各种各样的大模型。

目前 LLM 大模型也会存在3点局限性:

第一、简单的推理也会犯错。

第二、多聊几句就会忘记历史信息。

第三、写了代码不能运行验证。


2

使用 AI Agents进一步增强 LLM 大模型的能力

第一、什么是 Agent?

实际上,人类是这个星球上最强大的 Agent。Agent 是一个能感知并自主地采取行动的实体,这里的自主性极其关键,Agent 要能够实现设定的目标,其中包括具备学习和获取知识的能力以提高自身性能。

Agent 的 复杂程度各不相同,一个简单的恒温器可以是一个 Agent,一个大型的国家或者一个生物群体也可能是个 Agent。感知环境、自主决策、具备行动能力,设定明确的目标和任务,适应环境及学习能力,都是 Agent 的关键特点。

Agent 由三个部分组成:控制端(Brain)、感知端(Perception)和行动端(Action)。

我们来看下 Agent 的工作流程:当人类询问是否会下雨时,感知端(Perception)将指令转换为 LLMs 可以理解的表示。然后控制端(Brain)开始根据当前天气和互联网上的天气预报进行推理和行动规划。最后,行动端(Action)做出响应并将雨伞递给人类。

第二、什么是 AI Agent?

AI Agent 被设计为具有独立思考和行动能力的 AI 程序。你只需要提供一个目标,比如写一个游戏、开发一个网页,它就会根据环境的反应和独白的形式生成一个任务序列开始工作。就好像是人工智能可以自我提示反馈,不断发展和适应,以尽可能最好的方式来实现你给出的目标。

可以使用以下的公式来描述 AI Agent。

AI Agent = LLM(大语言模型推理能力) + Planning(规划能力) + Memory(记忆能力) + Tools(使用工具能力) + Action(行动能力)。

第三、AI Agent 如何进一步增强 LLM 大模型的能力?

LLM 与 LangChain 等工具相结合,释放了内容生成、编码和分析方面的多种可能性,目前在 ChatGPT-4 插件中比较有代表性的插件就是 Code Interpreter。

我们看一个“简单的难题”:尽管 ChatGPT-4 等模型非常强大、Agent 的发展似乎牛气冲天,它们仍然无法满足很多任务的需要,甚至一些在我们看来很简单的任务都完成不了,比如我们构造的这个任务:

我们必须明白,尽管 AI 在一定程度上模仿了人脑的工作方式,但实际上,机器人和人脑在处理信息时采用的策略有很大的不同。因此,即使在未来,我们也需要继续改进 AI 框架,以解决这种差距。比如一个百万位数的加法任务,ChatGPT-4 囿于 token 数的限制是不可能完成这个任务的,但人类却可以,这恰是人类和 AI 需要弥补的 Gap。我们进行了一些简单的试验,还没有发现大模型和 AI Agent 能搞定这个任务。其中,ChatGPT-4的 Code Interpreter 是表现最好的,因为它调用了外部计算器,但中间的过程描述还是发生了错误。


3

免费超干货大模型 AI Agents
直播

为了帮助同学们掌握好 AI Agents 的技术架构和应用案例实战,本周五晚上8点,我和陈东老师会开一场直播和同学们
深度聊聊 AI Agents
技术架构剖析、AI Agents 的应用案例实战、LLM 大模型的微调案例实战

请同学点击下方按钮预约直播
,咱们本周五晚8点不见不散哦~~

近期直播:

基于 LLM 大模型的微调构建AI Agents 案例实践

END

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值