书生浦语第五节课作业

离城非离秋。

已于 2024-04-15 20:34:38 修改

阅读量170

点赞数 3

文章标签： python 笔记

于 2024-04-15 20:13:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_64172770/article/details/137752458

版权

1.创建开发机以及配置环境下载模型

2.运行模型

3.使用LMDeploy与模型对话

速度要快很多

4.模型量化

首先保持不加该参数（默认0.8），运行1.8B模型，与模型对话，查看右上角资源监视器中的显存占用情况。

下面，改变--cache-max-entry-count参数，设为0.5。与模型对话，再次查看右上角资源监视器中的显存占用情况。

把--cache-max-entry-count参数设置为0.01，约等于禁止KV Cache占用显存。然后与模型对话，可以看到，此时显存占用仅为4560MB，代价是会降低模型推理速度。

5.量化：运行命令后得到量化后的模型

为了更加明显体会到W4A16的作用，我们将KV Cache比例再次调为0.01，查看显存占用情况。看到，显存占用变为2472MB，明显降低。

6.启动api服务器

在vscode终端直接通过命令行窗口与模型对话

网页端我死活加载不出来，放弃了

7.python代码集成并向传递参数

拓展部份我的网页端一直打不开并且说我的显存不够，好像10%太少了

...遂放弃

离城非离秋。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
书生浦语第五节课作业

为了更加明显体会到W4A16的作用，我们将KV Cache比例再次调为0.01，查看显存占用情况。看到，显存占用变为2472MB，明显降低。参数设置为0.01，约等于禁止KV Cache占用显存。然后与模型对话，可以看到，此时显存占用仅为4560MB，代价是会降低模型推理速度。首先保持不加该参数（默认0.8），运行1.8B模型，与模型对话，查看右上角资源监视器中的显存占用情况。与模型对话，再次查看右上角资源监视器中的显存占用情况。5.量化：运行命令后得到量化后的模型。6.启动api服务器。
复制链接

扫一扫

离城非离秋。 CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

149万+: 周排名

13万+: 总排名

2237: 访问

: 等级

147: 积分

23: 粉丝

33: 获赞

4: 评论

15: 收藏

私信

关注

热门文章

最新评论

书生浦语第七节作业
CSDN-Ada助手: 恭喜书生浦语在第七节作业中取得了不错的成绩，持续创作是提高写作水平的关键。希望你能继续保持创作的热情，不断提升自己的表达能力和文采。下一步可以尝试挑战一些不同风格或主题的作品，拓展自己的写作领域，加油！期待看到更多精彩的作品呈现在我们面前。
书生浦语第五节课作业
CSDN-Ada助手: 恭喜书生浦语在第五节课上提交了作业！持续创作是非常重要的，你已经展现出了坚持和努力的品质。接下来，或许可以尝试探索不同的主题或风格，让作品更加丰富多彩。期待你的下一篇作品！继续加油！
书生浦语第四节课作业
CSDN-Ada助手: 恭喜书生浦语完成了第四节课的作业，持续创作是成长的关键，希望你能够坚持下去，不断进步。在下一篇博客中，或许可以尝试探讨一些更深入的话题，或者加入一些个人观点和见解，让读者更加深入了解你的思考和感悟。期待你更加出色的作品！
书生浦语第二期第一节笔记
CSDN-Ada助手: 恭喜用户在“书生浦语第二期第一节笔记”中展现出了扎实的学习态度和认真的笔记能力。继续坚持创作，不断提升自己的写作水平是非常值得肯定的。建议在下一篇博客中，可以尝试加入一些个人观点或感悟，让读者更加深入地了解你对学习内容的理解和体会，期待你的更多精彩作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
安装mmseg时报的错即解决办法
CSDN-Ada助手: 非常感谢您分享了安装mmseg时遇到的问题及解决方法，这对遇到同样困扰的人来说无疑是一份宝贵的经验分享。除了版本问题，您在安装过程中可能还会遇到一些依赖库的缺失或者环境配置不当的情况，可以尝试使用虚拟环境、查看官方文档或者利用一些第三方工具来帮助解决。希望您能够继续分享更多关于技术方面的经验和心得，不断提升自己的技能水平。祝您在技术探索的道路上越走越远，不断突破自我，谢谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。