1、为什么要有智能体
大语言模型的局限性
- 幻觉:模型可能会生成虚假信息,与现实严重不符或脱节。
- 时效性:模型训练数据过时无法反映最新趋势和信息。
- 可靠性:面对复杂任务时可能频发错误输出现象,影响信任度。
什么是智能体
- 可以感知环境中的动态条件。
- 能采取动作影响环境。
- 能运用推理能力理解信息、解决问题、产生推断、决定动作。
智能体组成
- 大脑:作为控制器,,承担记忆、思考和决策任务。接受来自感知模块的信息,并采取相应动作。
- 感知:对外部环境的多模态信息进行感知和处理。包括但不限于图像、音频、视频、传感器等。
- 动作:利用并执行工具以影响环境。工具可能包括文本的检索、调用相关 API、操控机械臂等。
智能体范式
- AutoGPT
- ReWoo
- ReAct
2、Lagent & AgentLego
Lagent:
- 一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。
- 支持多种智能体范式。(如 AutoGPT、ReWoo、ReAct)
- 支持多种工具。(如谷歌搜索、Python解释器等)
AgentLego:
一个多模态工具包,旨在像乐高积木,可以快速简便地拓展自定义工具,从而组装出自己的智能体支持多个智能体框架。(如 Lagent、LangChain、Transformers Agents)提供大量视觉、多模态领域前沿算法。
两者的关系:
经过上面的介绍,我们可以发现,Lagent 是一个智能体框架,而 AgentLego 与大模型智能体并不直接相关,而是作为工具包,在相关智能体的功能支持模块发挥作用。
3、实战: Lagent & AgentLego 智能体应用搭建
技术文档:
Tutorial/agent/README.md at camp2 · InternLM/Tutorial · GitHub