1.0智能体的介绍
智能体的组成:
大脑:作为控制器,承担记忆、思考和决策任务。接受来自感知模块的信息,并采取相应动作。
感知:对外部环境的多模态信息进行感知和处理。包括但不限于图像、音频、视频、传感器等。
动作:利用并执行工具以影响环境。工具可能包括文本的检索、调用相关API、操控机械臂等。
2.0Lagent和AgentLego的介绍
2.1Lagent
一个轻量级开源智能Agent体框架,旨在让用户Plan-Act lteration可以高效地构建基于Search Plan-then-Act大语言模型的智能体。
2.2AgentLego
一个多模态工具包,旨在像乐高积木,可以快速简便地拓展自定义工具,从而组装出自己的智能体。支持多个智能体框架。
3.0 Lagent Web Demo 使用
首先创建开发机后启动一个 api_server,
接下来我们新建一个 terminal 以启动 Lagent Web Demo。
conda activate agent
cd /root/agent/lagent/examples
streamlit run internlm2_agent_web_demo.py --server.address 127.0.0.1 --server.port 7860
完成后连接端口,在本地的浏览器页面中打开 http://localhost:7860 以使用 Lagent Web Demo。然后如下图设置,就可以使用了。
4.0AgentLego的使用
4.1AgentLego 直接使用
首先下载demo文件,安装mim和mmdet,然后通过 touch /root/agent/direct_use.py
的方式在 /root/agent 目录下新建 direct_use.py 以直接使用目标检测工具,
接下来在执行 python /root/agent/direct_use.py
以进行推理。推理完成后,我们就可以看到如下输出以及一张位于 /root/agent 名为 road_detection_direct.jpg 的图片
4.2AgentLego作为智能体工具的使用
首先修改文件,
然后使用LMDeploy部署,启动 AgentLego WebUI。连接端口。在本地的浏览器页面中打开 http://localhost:7860 以使用 AgentLego WebUI。然后对Agent和工具进行配置。
点击上方 Chat 以进入对话页面。在页面下方选择工具部分只选择 ObjectDetection 工具,就可以使用了。