InternLM 实战营第五课 LMDeploy 量化部署 LLM 实践（实战部分）

最新推荐文章于 2024-08-06 13:52:03 发布

iris_abcd

最新推荐文章于 2024-08-06 13:52:03 发布

阅读量320

点赞数 6

文章标签：笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanwei416/article/details/138146169

版权

1.LMDeploy环境部署

在这里插入图片描述

2.LMDeploy模型对话(chat)

（1）下载模型
在这里插入图片描述
（2）使用Transformer库运行模型

（3）使用LMDeploy与模型对话

3.LMDeploy模型量化(lite)

3.1 设置最大KV Cache缓存大小

首先保持–cache-max-entry-count参数（默认0.8），运行1.8B模型。
在这里插入图片描述
改变–cache-max-entry-count参数，设为0.5，运行1.8B模型。

在这里插入图片描述
把–cache-max-entry-count参数设置为0.01，约等于禁止KV Cache占用显存。

在这里插入图片描述

**结论，**降低KV Cache缓存会明显减小显存占用，但也会降低模型推理速度。

3.2 使用W4A16量化

模型量化时间较久
使用Chat功能运行W4A16量化后的模型：
在这里插入图片描述

将KV Cache比例再次调为0.01，运行模型，查看显存占用情况明显降低

4.LMDeploy服务(serve)

以上为本地直接推理大模型，称为本地部署。
在生产环境中，将大模型封装为API接口，供客户端访问。

4.1 启动API服务器

在这里插入图片描述

API调用log

在这里插入图片描述

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
InternLM 实战营第五课 LMDeploy 量化部署 LLM 实践（实战部分）

（1）下载模型（2）使用Transformer库运行模型（3）使用LMDeploy与模型对话。
复制链接

扫一扫

iris_abcd CSDN认证博客专家 CSDN认证企业博客

码龄12年

11: 原创

48万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

306: 积分

89: 粉丝

114: 获赞

2: 评论

128: 收藏

私信

关注

热门文章

分类专栏

5g 1篇

最新评论

InternLM 实战营第三课 ——“茴香豆“：搭建你的 RAG 智能助理（实战练习：在 InternLM Studio 上部署茴香豆技术助手）
CSDN-Ada助手: 恭喜您在InternLM 实战营中取得了不错的进展，第三课的“茴香豆”搭建RAG智能助理的实战练习听起来非常有趣！能够成功部署茴香豆技术助手在InternLM Studio上，无疑是一次很棒的实践经验。希望您能继续保持创作的热情和耐心，不断学习和探索，拓展自己在人工智能领域的知识和技能。下一步的创作建议是可以尝试深入研究RAG智能助理的其他功能和应用场景，探索更多有趣的实战项目，不断提升自己的技术水平。加油！期待您更多精彩的博客内容！
InternLM 实战营第三课 ——“茴香豆“：搭建你的 RAG 智能助理（笔记）
CSDN-Ada助手: 恭喜用户写下了第四篇博客，内容涉及InternLM 实战营的第三课，分享了搭建 RAG 智能助理的经验和笔记，收获颇丰！希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许在下一篇博客中，可以分享一些实战经验或案例分析，让读者更加深入地了解主题。期待您的下一篇作品！愿您在创作的道路上不断进步，谦虚地学习和成长。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
InternLM 实战营第二课——轻松玩转书生·浦语大模型趣味 Demo
CSDN-Ada助手: 恭喜您写了第三篇博客，标题听起来很有趣呢！看来您对InternLM 实战营的学习进展顺利啊。接下来，我建议您可以结合书生·浦语大模型的趣味 Demo，深入探讨其中的技术细节，或者分享一些实战经验和心得体会，这样可以让读者更加深入地了解您的学习过程，也可以给其他学习者提供更多有价值的参考。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
InternLM 实战营第一课——书生·浦语大模型全链路开源体系
CSDN-Ada助手: 这篇博文记录了上海人工智能实验室在语言模型领域的重要进展，展示了他们在研究和开源方面的成果。希望作者能够继续分享实验室的最新成果和心得体会，让更多人了解人工智能的发展动态。除了语言模型，作者也可以关注一下多模态学习，这是人工智能领域的一个新兴方向，可以将文本、图像、音频等多种数据结合起来进行训练，提升模型的表现。希望作者能够继续探索这个领域，为AI技术的发展做出更多贡献。期待看到更多精彩的内容，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
AMF的发现和选择
ctotalk: 感谢分享,学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。