lmdeploy部署chatglm3模型并对话

环境准备

使用30% A100 来运行chatglm3模型,采用lmdeploy来启动。

创建虚拟环境

# 创建虚拟环境
conda create -n langchain python=3.11 -y

# 激活环境
conda activate langchain

安装组件

pip install -r requirements.txt

requirenments.txt 内容

langchain
modelscope
ipykernel
xtuner
lmdeploy

下载模型

download_model.py:
用于从魔搭下载chatglm3模型

from modelscope import snapshot_download
model_dir = snapshot_download("ZhipuAI/chatglm3-6b-32k", revision = "v1.0.0")
# 运行下载代码
python download_model.py

模型会下载到 /root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b-32k

chat启动模型并对话

直接采用lmdeploy chat启动并对话交互

lmdeploy chat /root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b-32k

在这里插入图片描述

显存使用20多G
在这里插入图片描述

启动成api_server服务并对话

# 通过api_server方式启动成一个API服务
lmdeploy serve api_server /root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b-32k \
                            --server-name 127.0.0.1 \
                            --model-name chatglm3-6b-32k 

启动后,运行在127.0.0.1的23333端口,使用的是fastAPI服务器
在这里插入图片描述
通过curl来访问这个api,对话:

curl -X 'POST' \
  'http://127.0.0.1:23333/v1/chat/completions' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "model": "chatglm3-6b-32k",
  "messages": [
    {
      "content": "hi,什么是股票",
      "role": "user"
    }
  ],
  "temperature": 0.7,
  "top_p": 1,
  "logprobs": false,
  "top_logprobs": 0,
  "n": 1,
  "max_tokens": null,
  "stop": null,
  "stream": false,
  "presence_penalty": 0,
  "frequency_penalty": 0,
  "user": "string",
  "repetition_penalty": 1,
  "session_id": -1,
  "ignore_eos": false,
  "skip_special_tokens": true,
  "top_k": 40
}'

文本补全

curl -X 'POST' \
  'http://127.0.0.1:23333/v1/completions' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "model": "chatglm3-6b-32k",
  "prompt":"今天天气不错" 
    
}'

注:具体的API可以访问23333端口来查看
在这里插入图片描述

启动成gradio服务

注意在lmdeploy 0.3.0上启动没问题,在0.4.2上启动会报错

lmdeploy serve gradio /root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b-32k

在这里插入图片描述启动后,就可以浏览器访问127.0.0.1:6006
在这里插入图片描述

lmdeploy 0.4.2上错误:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wengad

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值