第五课：【LMDeploy 量化部署 LLM&VLM实战】笔记

人工智能学习记录

已于 2024-05-07 20:12:44 修改

阅读量327

点赞数 10

分类专栏： InternLM训练营实践记录文章标签：笔记

于 2024-04-16 18:44:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44407313/article/details/137832440

版权

InternLM训练营实践记录专栏收录该内容

11 篇文章 0 订阅

订阅专栏

讲师：【安泓郡】西北工业大学博士生、书生·浦源挑战赛冠军队伍队长、第一期书生·浦语大模型实战营优秀学员带来

课程视频：LMDeploy 量化部署 LLM-VLM 实践_哔哩哔哩_bilibili

5.1大模型部署背景

实际部署大模型到需要的设备上——云端？机器？手机？

面临的挑战：

计算量大；

内存开销大；

访存瓶颈：时间花费在数据交换上

动态请求：

5.2大模型部署方法：

5.2.1模型剪枝：对贡献有效的冗余参数进行剪枝

1、非结构化

2、结构化

5.2.2知识蒸馏

5.2.3量化：损失浮点数精度（类似无损压缩）

为什么能提速？

浮点数计算，整数存储，减少精度损失，大模型访存密集，量化降低访存量，降低数据传输所需要的时间。提升效率的同时减少了推理时间。

5.3LMDeploy简介

LMDeploy是什么？

软件：涵盖LLM全套轻量化、部署、和服务解决方案。

LMDeploy核心功能：

（降低缓存占用）KV缓存管理器：将不用的缓存暂时放置在内存中，等需要使用的时候放入显存。

量化（不用的时候量化）——反量化（使用的时候量化）

LMDeploy性能表现：

新版本LMDeploy:不仅支持语言模型，也支持视觉模型

支持的大模型：

人工智能学习记录

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
第五课：【LMDeploy 量化部署 LLM&VLM实战】笔记

LMDeploy是什么？软件：涵盖LLM全套轻量化、部署、和服务解决方案。（降低缓存占用）KV缓存管理器：将不用的缓存暂时放置在内存中，等需要使用的时候放入显存。量化（不用的时候量化）——反量化（使用的时候量化）新版本LMDeploy:不仅支持语言模型，也支持视觉模型。
复制链接

扫一扫

专栏目录

人工智能学习记录 CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

122万+: 周排名

6万+: 总排名

7337: 访问

: 等级

349: 积分

97: 粉丝

137: 获赞

7: 评论

107: 收藏

私信

关注

热门文章

分类专栏

最新评论

leetcode 之数据结构与算法
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
深度优先搜索
CSDN-Ada助手: 恭喜您在博客中分享了关于深度优先搜索的知识，内容详实、易懂，让读者受益匪浅。希望您能继续坚持创作，分享更多优质的内容。下一步可以考虑拓展其他搜索算法的介绍，或者结合实际案例展示深度优先搜索的应用场景，让读者更深入地理解和运用这一算法。期待您的更多精彩文章！
leetcode 之数据结构与算法
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
leetcode 之数据结构与算法
CSDN-Ada助手: 恭喜您发布了第14篇博客“leetcode 之数据结构与算法”，看得出您对这个领域有着深厚的兴趣和研究。希望您能够继续保持创作的热情和坚持，不断分享您的学习心得和见解。或许在下一篇博客中，可以结合具体的算法实例或者实战经验，让读者更加深入地了解数据结构与算法的应用和实践。期待您的更多精彩内容，加油！
第二章使用 LLM API 开发应用
CSDN-Ada助手: 恭喜您写了第8篇博客！看来您对LLM API的应用开发已经有了很深入的了解。希望您能继续保持创作的热情，不断分享您的经验和成果。下一步，可以考虑深入探讨LLM API的高级用法或者结合其他技术进行更加丰富的应用开发，期待您的更多精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。