进阶作业（选两个，第二节和第五节）

lengbaihang

于 2024-02-19 16:21:17 发布

阅读量373

点赞数 8

文章标签：笔记人工智能深度学习语言模型 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lengbaihang/article/details/136172493

版权

本文探讨了如何对Internlm-chat-7b模型进行量化，包括使用KVCache量化，以及量化前后在API服务部署中显存大小的变化。量化后虽然显存有所减少，但4bit量化导致的模型性能下降显著，特别是对比bs=1和maxlen=512以及bs=8和maxlen=2048的情况。

摘要由CSDN通过智能技术生成

完成浦语·灵笔的图文理解及创作部署（需截图）
完成 Lagent 工具调用 Demo 创作部署（需截图）

对internlm-chat-7b模型进行量化，并同时使用KV Cache量化，使用量化后的模型完成API服务的部署，分别对比模型量化前后（将 bs设置为 1 和 max len 设置为512）和 KV Cache 量化前后（将 bs设置为 8 和 max len 设置为2048）的显存大小。

原模型占用14886MB

kv量化并没有省很多显存，占用大约14758MB

4bit量化显存占用5792MB

但模型性能下降太多

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lengbaihang CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

125万+: 周排名

14万+: 总排名

1万+: 访问

: 等级

443: 积分

134: 粉丝

219: 获赞

17: 评论

185: 收藏

私信

关注

热门文章

分类专栏

书生浦语第二期 14篇

最新评论

第五节课作业
CSDN-Ada助手: 恭喜您发布了第17篇博客，“第五节课作业”！持续创作是非常了不起的事情，您的努力和坚持一定会得到回报的。接下来，我想建议您可以尝试更多不同的主题和写作风格，这样能够帮助您不断提升自己的写作技巧和思维深度。期待看到您更多精彩的作品，加油！
第五节课笔记
CSDN-Ada助手: 恭喜您写了第18篇博客《第五节课笔记》，持续创作不易，您的坚持和努力可嘉！希望您在未来的创作中能多加思考和总结，让读者能够更加深入地了解您的观点和见解。加油！期待您更多精彩的作品！
第四节课笔记
CSDN-Ada助手: 恭喜您写了第20篇博客《第四节课笔记》，持续坚持创作，实属不易。希望您能在下一篇博客中分享更多关于第四节课的知识和心得体会，让读者能够更深入地了解这个话题。期待您的下一篇作品，加油！
第三节课笔记与作业
CSDN-Ada助手: 恭喜您第16篇博客《第三节课笔记与作业》发表成功！持续创作是提升自己的最好方式，希望您能坚持下去，继续分享您的学习心得和感悟。或许下一步可以考虑与读者分享一些实践经验或者案例分析，让读者更加深入地了解您所学习的内容。期待您更多精彩的作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。