图解LLM智能体(LLM Agents):构建与运作机制的全面解析

LLM智能体:构建与运作机制

LLM智能体(LLM Agents)正在迅速普及,似乎逐渐取代了我们熟悉的传统对话式LLM。这些令人惊叹的能力并非凭空而来,而是需要多个组件协同工作。LLM Agents架构
本文包含超过60张定制插图,将深入探讨LLM智能体的领域、其核心组件以及多智能体框架的工作原理。

什么是LLM智能体?

要理解LLM智能体是什么,首先我们需要了解LLM的基本能力。传统上,LLM的核心功能不过是“下一个词预测”。
Next-Token预测

通过连续采样多个词,我们可以模拟对话并让LLM生成更长的回答。

对话生成

然而,当我们继续“对话”时,任何LLM都会暴露出其主要缺点之一:它无法记住之前的对话!记忆缺失
此外,LLM在许多任务上表现不佳,例如基本的数学运算(乘法和除法):数学运算失败
这是否意味着LLM很糟糕?绝对不是!LLM不需要全能,因为我们可以借助外部工具、记忆系统和检索机制来弥补其不足。

通过外部系统,LLM的能力可以得到增强。Anthropic将其称为“增强型LLM”。增强型LLM

例如,当面对数学问题时,LLM可以选择使用适当的工具(如计算器)。
使用计算器
那么,这种“增强型LLM”就是智能体吗?不完全是,但某种程度上是……


智能体的定义

智能体是可以被视为通过传感器感知环境并通过执行器作用于环境的任何事物。
——Russell & Norvig,《人工智能:现代方法》(2016)

智能体与环境交互,通常由以下几个重要组件组成:

  • 环境——智能体交互的世界
  • 传感器——用于观察环境
  • 执行器——用于与环境交互的工具
  • 效应器——决定如何从观察到行动的“大脑”或规则

智能体框架
该框架适用于各种与不同环境交互的智能体,例如与物理环境交互的机器人或与软件交互的AI智能体。

我们可以对该框架进行一些泛化,使其适合“增强型LLM”。
增强型LLM框架

通过“增强型LLM”,智能体可以通过文本输入(因为LLM通常是文本模型)观察环境,并通过工具(如网络搜索)执行某些操作。

为了选择采取哪些行动,LLM智能体有一个关键组件:规划能力。为此,LLM需要能够通过链式思维等方法进行“推理”和“思考”。

链式思维

通过这种推理行为,LLM智能体可以规划出必要的行动步骤。
规划行为

这种规划行为使智能体能够理解当前情境(LLM)、规划下一步(规划)、采取行动(工具)并跟踪已采取的行动(记忆)。

智能体循环

根据系统的不同,LLM智能体可以具备不同程度的自主性。
自主性等级

可以说,一个系统越“智能”,LLM就越能决定系统的行为方式。

在接下来的部分中,我们将通过LLM智能体的三个主要组件——记忆工具规划——探索各种自主行为的方法。


记忆

LLM是一种健忘的系统,或者更准确地说,在交互过程中不会进行任何记忆。

例如,当你向LLM提问后紧接着再问另一个问题时,它不会记住前者。短时记忆问题

我们通常将这种记忆称为短期记忆,也叫工作记忆,它充当即时上下文的缓冲区。这包括LLM智能体最近采取的行动。

然而,LLM智能体还需要记录可能数十个步骤,而不仅仅是最近的行动。长期记忆需求

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI仙人掌

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值