智能体
大语言模型的局限性:
- 幻觉(虚假信息)
- 缺乏时效性
- 复杂任务面前的可靠性
智能体的定义[^1]
- 可以感知环境中的动态条件
perception of dynamic conditions in the environment - 能够采取动作影响环境
action to affect conditions in the environment - 能运用推理能力理解信息、解决问题、产生推断
resoning to interpret perceptions, solve problems, draw inferences and determine actions
[^1]:Hayes·Roth 1995. An Architecture for Adaptive Intelligent Systems.
智能体的组成
- 大脑:作为控制器,承担记忆、思考和决策任务。接受来自
感知模块的信息,并采取相应动作。 - 感知:对外部环境的多模态信息进行感知和处理。包括但不
限于图像、音频、视频、传感器等。 - 动作:利用并执行工具以影响环境。工具可能包括文本的检
索、调用相关API、操控机械臂等。
经典智能体
- AutoGPT
- ReWoo
- ReAct
Lagent与AgentLego
Lagent
轻量级开源智能体框架,可高效搭建基于LLM的智能体
- 支持多种智能体范式
- 支持多种工具
AgentLego
多模态工具包,可简便拓展工具,组装自己的智能体
- 支持多个智能体框架
- 提供视觉、多模态领域的前沿算法
两者的关系
当LLM对感知的信息经判断需要调用工具时,会使用Lagent为例的工具框架逻辑,其中包括AgentLego算法库提供的多模态工具的功能支持