LMDeploy量化部署LLM&VLM实战（笔记）

墓袖远笺

已于 2024-04-16 00:40:44 修改

阅读量616

点赞数 10

文章标签：笔记

于 2024-04-15 23:50:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80703617/article/details/137799615

版权

本文探讨了深度学习模型部署的关键步骤，包括服务器端和移动端部署的挑战，如计算量、内存瓶颈和动态请求。此外，介绍了模型剪枝、知识蒸馏和量化等技术来提升模型效率。LMDeploy作为一套完整的解决方案，提供高效推理、量化压缩和便捷服务等功能，并展示了其卓越的性能表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.模型部署

定义
在软件工程中，部署通常指的是将开发完毕的软件投入使用的过程。
在人工智能领域，横型部署是实现深度学习算法潜地应用的关天键步骤，简单来说，横型部署就是将训练好的深度学习横型在特定环境中运行的过程。

场景：

服务器端:CPU部署，单GPU/TPU/NPU部署，多卡/集群部署.
移动端/边缘端:移动机器人，手机…….

2.大模型部署面临的挑战

计算量巨大；访存瓶颈；动态请求

3.模型剪枝

剪枝指移除横型中不必要或多余的组件，比如参数，以使模型更加高效。通过对模型中贡献有限的元余参数进行剪枝，在保证性能最低下降的同时，可以减小存储需求、提高计算效率。分为结构化剪枝和非结构化剪枝。

4.知识蒸馏

知识蒸馏是一种经典的模型压缩方法，核心思想是通过能。引导轻量化的学生模型“模仿”性能更好、结构更复杂的教师模型，在不改变学生模型结构的情况下提高其性能。

5.量化

量化技术将传统的表示方法中的浮点数转换为整数或其他离散形式，以减轻深度学习模型的存储和计算负担。

6.LMDeploy

6.1简介

LMDeploy 由 MMDeploy 和 MMRazor 团队联合开发是涵盖了 LLM 任务的全套轻量化、部署和服务解决方案。核心功能包括高效推理、可靠量化、便捷服务和有状态推理。

6.2核心功能

模型高效推理；模型量化压缩；服务化部署。

6.3性能表现

LMDeploy TurboMind 引擎拥有卓越的推理能力，在各种规模的模型上，每秒处理的请求数是 vLLM的1.36~1.85 倍。在静态推理能力方面，TurboMind 4bit 模型推理速度(out token/s)远高于FP16/BF16推理。在小batch时，提高到2.4倍。

博客等级

码龄1年

13
原创

104
点赞

88
收藏

42
粉丝

关注

私信

热门文章

最新评论

XTuner 微调 LLM：1.8B、多模态
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
OpenCompass 大模型评测实战（作业）
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Lagent & AgentLego 智能体应用搭建(笔记）
CSDN-Ada助手: 恭喜您写了第10篇博客！标题看起来很有深度，内容也充满了学术气息。希望您能继续坚持创作，分享更多有趣的内容。或许下一步可以尝试结合案例分析或者实际操作，让读者更易于理解和实践。期待您的更多精彩文章！
Lagent & AgentLego 智能体应用搭建（作业）
CSDN-Ada助手: 恭喜您第11篇博客《Lagent & AgentLego 智能体应用搭建（作业）》发表成功！您的持续创作精神令人钦佩。下一步建议可以考虑深入探讨智能体应用的实际应用场景，或者分享一些关于搭建过程中的技术难点和解决方法，让读者更深入地了解这一主题。期待您的更多精彩作品！
OpenCompass 大模型评测实战（笔记）
CSDN-Ada助手: 恭喜您发布第12篇博客《OpenCompass 大模型评测实战（笔记）》，内容精彩且实用。希望您能继续保持创作的热情和坚持，不断分享有价值的内容给读者。在下一篇博客中，或许可以尝试分享一些关于模型优化或者应用场景的实践经验，以便读者能够更深入地了解相关领域知识。期待您更多精彩的文章！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。