Lagent & AgentLego 智能体应用搭建
为什么要有智能体
大语言模型的局限性
幻觉
模型可能会生成虚假信息,与现实严重不符或脱节。
时效性
模型训练数据过时,无法反映最新趋势和信息。
可靠性
面对复杂任务时可能频发错误输出现象,影响信任度。
什么是智能体
可以感知环境中的动态条件。
(perception of dynamic conditions in the environment)
能采取动作影响环境。
(action to affect conditions in the environment)
能运用推理能力理解信息、解决问题、产生推断、决定动作。
(reasoning to interpret perceptions, solve problems,draw inferences, and determine actions)
——Hayes-Roth 1995.An Architecture for Adaptive Intelligent Systems
智能体组成
大脑:作为控制器,承担记忆、思考和决策任务。接受来自感知模块的信息,并采取相应动作。
感知:对外部环境的多模态信息进行感知和处理。包括但不限于图像、音频、视频、传感器等。
动作:利用并执行工具以影响环境。工具可能包括文本的检索、调用相关 API、操控机械臂等。
智能范式
Lagent & AgentLego
Lagent
Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。
Lagent 目前已经支持了包括 AutoGPT、ReAct 等在内的多个经典智能体范式,也支持了如下工具:
Arxiv 搜索
Bing 地图
Google 学术搜索
Google 搜索
交互式 IPython 解释器
IPython 解释器
PPT
Python 解释器
AgentLego
AgentLego 是一个提供了多种开源工具 API 的多模态工具包,旨在像是乐高积木一样,让用户可以快速简便地拓展自定义工具,从而组装出自己的智能体。通过 AgentLego 算法库,不仅可以直接使用多种工具,也可以利用这些工具,在相关智能体框架(如 Lagent,Transformers Agent 等)的帮助下,快速构建可以增强大语言模型能力的智能体。
AgentLego 目前提供了如下工具:
两者的关系
经过上面的介绍,我们可以发现,Lagent 是一个智能体框架,而 AgentLego 与大模型智能体并不直接相关,而是作为工具包,在相关智能体的功能支持模块发挥作用。
基础作业
- 完成 Lagent Web Demo 使用,并在作业中上传截图。文档可见 Lagent Web Demo
- 完成 AgentLego 直接使用部分,并在作业中上传截图。文档可见 直接使用 AgentLego