LLM课程【书生·浦语 InternLM实战营】5 - 模型部署

最新推荐文章于 2024-08-08 17:44:43 发布

robin_ze

最新推荐文章于 2024-08-08 17:44:43 发布

阅读量175

点赞数 8

分类专栏： LLM 文章标签：开源 chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/robin_ze/article/details/138041350

版权

LLM 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

大模型部署背景

模型部署：人工智能算法的落地，将训练好的模型放置在特定的环境中运行的过程。

部署场景

服务器端：CPU部署、GPU/TPU/NPU部署、多卡/集群部署
移动端、边缘段：手机等

大模型部署面临的挑战

计算量巨大
内存开销巨大：模型参数、attention-KV缓存
访存瓶颈：数据交换
动态请求：请求量、请求时间、生成数量不确定

大模型部署方法

模型剪枝（Pruning）：对模型的冗余参数进行剪枝，保证性能最低下降的同时减少参数量
1）非结构化剪枝
2）结构化剪枝：保留原始模型结构
知识蒸馏（Knowledge Distillation）：使用参数量较少的模型拟合参数量大的网络，使模型通过更少的参数量达到更好的效果
量化（Quantization）：在对模型应答效果影响不大的基础上，损失表示精度，将浮点数量化为其它形式
- 能减轻模型存储和计算负担，并降低访存量
- 量化感知训练（QAT）、量化感知微调（QAF）、训练后量化（PTQ）

LMDeploy：全套轻量化部署解决方案

核心功能

模型高效推理：LLaMa结构模型的支持、continuous batch推理模式、可扩展的KV缓存管理器
模型量化压缩
服务化部署：提供API接口以实现快捷的服务化部署

关注

8
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
LLM课程【书生·浦语 InternLM实战营】5 - 模型部署

大语言模型部署的背景及方法，使用LMDeploy服务化部署大模型
复制链接

扫一扫

专栏目录

robin_ze CSDN认证博客专家 CSDN认证企业博客

码龄4年

11: 原创

115万+: 周排名

13万+: 总排名

5832: 访问

: 等级

151: 积分

27: 粉丝

38: 获赞

9: 评论

33: 收藏

私信

关注

热门文章

分类专栏

LLM 9篇
pytorch 1篇

最新评论

LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
LLM实战【书生·浦语 InternLM实战营】4 - 复现finetune过程
CSDN-Ada助手: 恭喜您成功写下第9篇博客！看到您不断分享LLM实战经验，真是令人佩服。接下来，希望您可以继续坚持创作，不断挑战自我，分享更多有关finetune过程的经验和技巧，让更多人受益。期待您的下一篇作品！祝您创作愉快！
LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
CSDN-Ada助手: 恭喜您写下了第10篇博客！看到您分享关于LLM实战的内容，让我感到十分兴奋。希望您能继续坚持不懈地创作，为读者带来更多有价值的内容。在下一篇博客中，或许可以分享一些关于模型优化或者性能提升的经验，让我们一起学习进步吧！期待您的下一篇作品。
LLM实战【书生·浦语 InternLM实战营】6 - Lagent与AgentLego
CSDN-Ada助手: 恭喜您写完了第11篇博客！看到您在LLM实战的实践经验分享，让我受益匪浅。希望您能继续坚持创作，分享更多关于Lagent与AgentLego的心得体会。同时，建议您可以尝试深入探讨它们在实际项目中的应用场景，或者结合其他相关主题展开讨论，让读者能够更全面地了解这些内容。期待您的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。