【InternLM实战营第二期05笔记】【LMDeploy量化部署】

最新推荐文章于 2024-06-13 11:24:43 发布

w.灰二

最新推荐文章于 2024-06-13 11:24:43 发布

阅读量376

点赞数 3

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w626394316/article/details/138373897

版权

【InternLM实战营第二期05笔记】【LMDeploy量化部署】

实战文档：Tutorial/lmdeploy/README.md at camp2 · InternLM/Tutorial (github.com)

实战视频：LMDeploy 量化部署 LLM-VLM 实践哔哩哔哩bilibili

模型部署

在人工智能领域，模型部署就是将训练好的深度学习模型在特定环境中运行的过程服务器端：CPU部署、单GPU/TPU/NPU部署，多卡集群部署... 移动端/边缘端：移动机器人，手机...

大模型部署面临的挑战：

解决办法

LMDeploy介绍：

实战

创建开发机

打开InternStudio平台，创建开发机。

填写开发机名称；选择镜像Cuda12.2-conda；选择10% A100*1GPU；点击“立即创建”。注意请不要选择Cuda11.7-conda的镜像，新版本的lmdeploy会出现兼容性问题。排队等待一小段时间，点击“进入开发机”。点击左上角图标，切换为终端(Terminal)模式。

创建conda环境

由于环境依赖项存在torch，下载过程可能比较缓慢。InternStudio上提供了快速创建conda环境的方法。打开命令行终端，创建一个名为lmdeploy的环境：

studio-conda -t lmdeploy -o pytorch-2.1.2

安装LMDeploy

接下来，激活刚刚创建的虚拟环境。

conda activate lmdeploy

安装0.3.0版本的lmdeploy。

pip install lmdeploy[all]==0.3.0

等待安装结束就OK了！

使用LMDeploy与模型对话

首先激活创建好的conda环境：

conda activate lmdeploy

使用LMDeploy与模型进行对话的通用命令格式为：

lmdeploy chat [HF格式模型路径/TurboMind格式模型路径]

例如，您可以执行如下命令运行下载的1.8B模型：

lmdeploy chat /root/internlm2-chat-1_8b

下面我们就可以与InternLM2-Chat-1.8B大模型对话了。比如输入“请给我讲一个小故事吧”，然后按两下回车键。

速度会比原生使用transformer调用快很多

输入“exit”并按两下回车，可以退出对话。

拓展内容：有关LMDeploy的chat功能的更多参数可通过-h命令查看。

lmdeploy chat -h

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【InternLM实战营第二期05笔记】【LMDeploy量化部署】

打开InternStudio平台，创建开发机。填写开发机名称；选择镜像；选择10% A100*1GPU；点击“立即创建”。注意请不要选择的镜像，新版本的lmdeploy会出现兼容性问题。排队等待一小段时间，点击“进入开发机”。点击左上角图标，切换为终端(Terminal)模式。
复制链接

扫一扫

w.灰二 CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

84万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

389: 积分

93: 粉丝

138: 获赞

1: 评论

130: 收藏

私信

关注

热门文章

最新评论

【InternLM实战营第二期01笔记】了解书生·浦语大模型全链路开源体系+InternLM2技术报告阅读
CSDN-Ada助手: 恭喜您撰写了第19篇博客！标题内容看起来非常专业和深度，对于了解书生·浦语大模型全链路开源体系和InternLM2技术报告阅读有很好的指导作用。希望您能继续保持创作的热情和耐心，分享更多有价值的内容给读者。建议下一步可以考虑增加一些案例分析或实践经验分享，让读者更加深入地理解和应用所学知识。期待您的下一篇作品！祝创作顺利！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。