书生·浦语LLM 第五节课作业

吴意义

已于 2024-05-05 12:43:31 修改

阅读量237

点赞数 7

分类专栏：书生·浦语LLM 文章标签：笔记

于 2024-04-27 23:35:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45571283/article/details/138260660

版权

书生·浦语LLM 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

一、配置 LMDeploy 运行环境：
下载好的预训练模型如上图。

二、以命令行方式与 InternLM2-Chat-1.8B 模型对话：

1.使用Transformer库运行模型：

2.使用LMDeploy与模型对话：

能明显感觉到LMDeploy比Transformer速度快很多。

3.速度比较：

（1）加载模型的速度：

transformer约一分半，如下图：

lmdeploy约46s，如下图：

（2）生成西瓜的故事：

transformer约19秒，如下图：

lmdeploy约3s，如下图：

4.LMDeploy模型量化（lite）

1.无限制：

2. --cache-max-entry-count 0.1

3.--cache-max-entry-count 0.01 几乎禁止KV Cache占用显存：

总结：禁用前后模型加载速度和推理速度衰减不明显，可能是“生成小故事”过于简单。具体差异应该会在复杂问题的推理上体现。

四、总结

运行方式对比	Transformer	LMDeploy
加载模型	76-95s	46s
生成故事	19s	3-4s

显存限制对比	无限制	0.1	0.01
显存占用	7856	4944	4560
生成小故事速度	约4s	约4s	约4s

关注

7
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
书生·浦语LLM 第五节课作业

总结：禁用前后模型加载速度和推理速度衰减不明显，可能是“生成小故事”过于简单。具体差异应该会在复杂问题的推理上体现。能明显感觉到LMDeploy比Transformer速度快很多。4.LMDeploy模型量化（lite）
复制链接

扫一扫

专栏目录

吴意义 CSDN认证博客专家 CSDN认证企业博客

码龄5年

25: 原创

133万+: 周排名

8万+: 总排名

8840: 访问

: 等级

332: 积分

64: 粉丝

79: 获赞

4: 评论

71: 收藏

私信

关注

热门文章

分类专栏

书生·浦语LLM 13篇
PTA 10篇

最新评论

书生·浦语LLM 第七节课作业
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
书生·浦语LLM 第六节课笔记
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
书生·浦语LLM 第五节课作业
CSDN-Ada助手: 恭喜书生·浦语LLM在第五节课作业中取得了不错的成绩！持续创作是非常重要的，希望您能够保持这样的热情和努力，继续分享您的学习心得和见解。或许在下一篇博客中，可以尝试探讨一些实践经验或者案例分析，这样可以为读者提供更多有益的信息和启发。期待您更加精彩的创作，加油！
书生·浦语LLM 第五节课笔记
CSDN-Ada助手: 恭喜作者在书生·浦语LLM的第五节课中做了详细的笔记并分享在博客中。持续创作是提升自己知识水平的好途径，也让更多人受益。希望作者在以后的创作中能够更加深入地探讨课程内容，分享自己的学习心得，让读者有更多收获。加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。