任务
基础任务(完成此任务即完成闯关)
- 使用 Lagent 自定义一个智能体,并使用 Lagent Web Demo 成功部署与调用,记录复现过程并截图。
耗时
2h左右
背景介绍
每个任务的惯用套路,什么技术什么乱七八套一系列名词。它们很重要,但没必要过度研究。只有动手才能理解的更深。开始只需要记得这些技术最核心最关键的东西即可。
我目前理解agent就是汽车:大模型如同发动机,一辆汽车不单单靠发动机就能上路、吹空调、播放音乐,而agent就可以。
环境配置
跟着官方文档来Tutorial/docs/L2/Lagent/readme.md at camp3 · InternLM/Tutorial (github.com)
这里遇到一个问题 说ssl证书不行
解决办法: --trusted-host 跳过
pip install termcolor==2.4.0 --trusted-host pypi.tuna.tsinghua.edu.cn
pip install lmdeploy==0.5.2 --trusted-host pypi.tuna.tsinghua.edu.cn
cd /root/agent_camp3/lagent && git checkout 81e7ace && pip install -e . --trusted-host pypi.tuna.tsinghua.edu.cn && cd ..
pip install griffe==0.48.0 --trusted-host pypi.tuna.tsinghua.edu.cn
安装好资源包后,用lmdeploy启动web demo
这时候我们可以用tmux管理 ,只需要最简单的几行就够了,
创建好不用管这个窗口,x掉再tmux attach-session -t my_session 就还可以连接
tmux
简单用法
apt-get install tmux
- 新建会话
tmux new -s my_session
。- 在 Tmux 窗口运行所需的程序。
- 按下快捷键
Ctrl+b d
将会话分离。- 下次使用时,重新连接到会话
tmux attach-session -t my_session
。
我们先使用 LMDeploy 部署 InternLM2.5-7B-Chat,并启动一个 API Server。
tmux new -s my_session
conda activate agent_camp3
lmdeploy serve api_server /share/new_models/Shanghai_AI_Laboratory/internlm2_5-7b-chat --model-name internlm2_5-7b-chat
我们在另一个窗口中启动 Lagent 的 Web Demo。
tmux new -s my_session2
cd /root/agent_camp3/lagent
conda activate agent_camp3
streamlit run examples/internlm2_agent_web_demo.py
本地映射
ssh -CNg -L 8501:127.0.0.1:8501 -L 23333:127.0.0.1:23333 root@ssh.intern-ai.org.cn -p <你的 SSH 端口号>
我的是8502
ssh -CNg -L 8502:127.0.0.1:8502 -L 23333:127.0.0.1:23333 root@ssh.intern-ai.org.cn -p 42853
class_registry包错误 ,那我 重新安装class_registry
pip uninstall class_registry
pip install class_registry --trusted-host pypi.tuna.tsinghua.edu.cn
然后重启web demo ,端口号到8503 需要重新映射,记得换模型名称和ip地址
到这里终于可以搞精华部分了,前面罗里吧嗦一大堆的环境但是不搞还真不行。
基于 Lagent 自定义智能体
Lagent 中关于工具部分的介绍文档位于 动作 — Lagent 。(
下面我们将实现一个调用 MagicMaker API 以完成文生图的功能。
cd /root/agent_camp3/lagent
touch lagent/actions/magicmaker.py
然后把下面代码贴进去
import json
import requests
from lagent.actions.base_action import BaseAction, tool_api
from lagent.actions.parser import BaseParser, JsonParser
from lagent.schema import ActionReturn, ActionStatusCode
class MagicMaker(BaseAction):
styles_option = [
'dongman', # 动漫
'guofeng', # 国风
'xieshi', # 写实
'youhua', # 油画
'manghe', # 盲盒
]
aspect_ratio_options = [
'16:9', '4:3', '3:2', '1:1',
'2:3', '3:4', '9:16'
]
def __init__(self,
style='guofeng',
aspect_ratio='4:3'):
super().__init__()
if style in self.styles_option:
self.style = style
else:
raise ValueError(f'The style must be one of {self.styles_option}')
if aspect_ratio in self.aspect_ratio_options:
self.aspect_ratio = aspect_ratio
else:
raise ValueError(f'The aspect ratio must be one of {aspect_ratio}')
@tool_api
def generate_image(self, keywords: str) -> dict:
"""Run magicmaker and get the generated image according to the keywords.
Args:
keywords (:class:`str`): the keywords to generate image
Returns:
:class:`dict`: the generated image
* image (str): path to the generated image
"""
try:
response = requests.post(
url='https://magicmaker.openxlab.org.cn/gw/edit-anything/api/v1/bff/sd/generate',
data=json.dumps({
"official": True,
"prompt": keywords,
"style": self.style,
"poseT": False,
"aspectRatio": self.aspect_ratio
}),
headers={'content-type': 'application/json'}
)
except Exception as exc:
return ActionReturn(
errmsg=f'MagicMaker exception: {exc}',
state=ActionStatusCode.HTTP_ERROR)
image_url = response.json()['data']['imgUrl']
return {'image': image_url}
magicmaker是个工具(字生图的工具)。对这个代码可以简单研究下,也就懂了 Lagent 自定义工具是个怎么回事。
magicmaker就两个函数 init 和 generate_image
init 初始化函数 ;generate_image 字生图函数
init函数 初始化了风格和分辨率
generate_image函数
还是蛮简单,那么再难的工具,本质都是拿数据罢了 。
然后在/root/agent_camp3/lagent/examples/internlm2_agent_web_demo.py
来适配我们的magicmaker工具
再重新运行web demo
模型名称:internlm2_5-7b-chat
模型ip:127.0.0.1:23333
插件选两个
结果