《Llama3》-LMDeploy 高效部署 Llama3 实践

最新推荐文章于 2024-07-19 16:36:18 发布

martiliu

最新推荐文章于 2024-07-19 16:36:18 发布

阅读量463

点赞数 16

分类专栏：大模型AI 文章标签：语言模型 python vscode

本文链接：https://blog.csdn.net/martiliu/article/details/138921522

版权

大模型AI 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1、安装LMDeploy

conda create -n lmdeploy python=3.10 conda activate lmdeploy conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

#安装lmdeploy最新版。

pip install -U lmdeploy[all]

2、LMDeploy Chat CLI 工具

lmdeploy chat /root/model/Meta-Llama-3-8B-Instruct

运行完毕后，出现问题输入提示，可以开始问Llama3问题了

3、使用W4A16量化

lmdeploy lite auto_awq \
   /root/model/Meta-Llama-3-8B-Instruct \
  --calib-dataset 'ptb' \
  --calib-samples 128 \
  --calib-seqlen 1024 \
  --w-bits 4 \
  --w-group-size 128 \
  --work-dir /root/model/Meta-Llama-3-8B-Instruct_4bit

运行完毕后，在~/model/目录下可以看到生成的 Meta-Llama-3-8B-Instruct_4bit 模型

通过以下指令可以运行刚刚创建的4bit模型
lmdeploy chat /root/model/Meta-Llama-3-8B-Instruct_4bit --model-format awq

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

martiliu

关注关注

16
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《Llama3》-LMDeploy 高效部署 Llama3 实践

运行完毕后，在~/model/目录下可以看到生成的 Meta-Llama-3-8B-Instruct_4bit 模型。运行完毕后，出现问题输入提示，可以开始问Llama3问题了。2、LMDeploy Chat CLI 工具。通过以下指令可以运行刚刚创建的4bit模型。#安装lmdeploy最新版。1、安装LMDeploy。3、使用W4A16量化。
复制链接

扫一扫