书生浦语LMDeploy量化部署LLM和VLM实践

最新推荐文章于 2024-07-18 15:53:23 发布

蓝天嘿嘿

最新推荐文章于 2024-07-18 15:53:23 发布

阅读量248

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/danteblack/article/details/137727018

版权

进入InternStudio平台，创建开发机，使用10%的A100即可，这部分实验进行之前，看说明是10%即可，不过想操作的快一些投机取巧用了30%的GPU，不过实际操作的时候发现，你给多少GPU显存基本都会被用光了，实际推理的时候基本上都是90%以上GPU显存占用。

先把transformers跑起来，

再测试Lmdeploy，确实感觉速度更快一些，

量化kv cache为0.5之后，发现显存下降挺明显的，少了5GB左右，

接下来进行极致的压缩设置kv cache 0.0.1，显存下降到5GB左右，很弱的显卡也可以跑推理了，

使用AWQ算法，实现模型4bit权重量化，接下来就做这个测试，

接下来将kv cache残忍的调整成0.0.1，基本上读取模型权重的时候已经是2GB左右了，

模型部分的实验完毕后，就是包装大模型为api接口进行应用测试的操作了，

用fastapi把跑起来的模型发布出去，

通过cli的方式对话，测试运行正常，

接下来就是通过经典的gradio来通过调用api接口的方式进行测试了，

接下来进行量化测试，量化真实不错，省显卡！

这次作业有点多，接下来还要做python sdk模式的测试，按部就班的做就好了，

量化测试，

最后是多模态，用llava测试，说是10%GPU 8GB就可以，你看看开到30%，24GB显存，运行llava也基本满了，

llava中文能力确实弱，啥叫老虎獾？

gradio老朋友再搞起来！

扔了一张显示器的图片，应该算是降低难度了吧？

很奇怪说llava中文很差，为啥我追问了一个问题，他主动用中文回答我？

因为开的是30%A100，全搞定了，还剩一些时间，不用了也浪费，把加餐的作业也做了，就是比较transformers和lmdeploy的速度，这个速度差距挺大的，45和230！是不是因为lmdeploy对internlm2-chat-1_8b做过优化了？

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
书生浦语LMDeploy量化部署LLM和VLM实践

进入InternStudio平台，创建开发机，使用10%的A100即可，这部分实验进行之前，看说明是10%即可，不过想操作的快一些投机取巧用了30%的GPU，不过实际操作的时候发现，你给多少GPU显存基本都会被用光了，实际推理的时候基本上都是90%以上GPU显存占用。因为开的是30%A100，全搞定了，还剩一些时间，不用了也浪费，把加餐的作业也做了，就是比较transformers和lmdeploy的速度，这个速度差距挺大的，45和230！使用AWQ算法，实现模型4bit权重量化，接下来就做这个测试，
复制链接

扫一扫

蓝天嘿嘿 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

57万+: 周排名

9万+: 总排名

5615: 访问

: 等级

241: 积分

58: 粉丝

98: 获赞

8: 评论

69: 收藏

私信

关注

热门文章

最新评论

termius无法下载linux远端文件到本地windows电脑，权限不足的报错
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
书生浦语-测试compass 大模型评测实战
CSDN-Ada助手: 恭喜书生浦语撰写了第13篇博客，标题为“测试compass 大模型评测实战”。您的文章内容充实且实用，对于测试compass大模型评测有很好的实战经验分享，让读者受益匪浅。希望您能继续保持创作的热情和耐心，不断提升自己的写作水平和内容质量。下一步，建议您可以尝试探索更多相关领域的知识，拓宽文章的主题范围，为读者带来更多新颖有趣的内容。期待您的下一篇精彩之作！
Azure安全策略更新？揭秘SSH（密钥方式）连接失败的背后真相
m0_61067876: 写的很好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
Azure安全策略更新？揭秘SSH（密钥方式）连接失败的背后真相
CSDN-Ada助手: 恭喜您发布了第11篇博客！标题“Azure安全策略更新？揭秘SSH（密钥方式）连接失败的背后真相”听起来非常引人注目。对于SSH连接失败的背后真相进行揭秘，无疑是对读者极具帮助的信息。希望您能继续保持创作热情，探索更多有趣的主题。或许在下一篇博客中，您可以分享一些关于网络安全的最佳实践或者云端存储的使用技巧，让读者受益匪浅。期待您的下一篇精彩的博客！
书生浦语LMDeploy量化部署LLM和VLM实践
CSDN-Ada助手: 恭喜您在量化领域的持续探索和分享！看到您的新博客标题，我对您的专业知识和实践经验感到佩服。希望您在未来的创作中可以继续深入探讨LMDeploy量化部署的实践，或者分享更多关于LLM和VLM的应用案例和心得体会。期待您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。