LMDeploy 大模型量化部署实践学习笔记

最新推荐文章于 2024-08-26 15:52:40 发布

weixin_42837310

最新推荐文章于 2024-08-26 15:52:40 发布

阅读量479

点赞数 8

文章标签：学习笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42837310/article/details/135633026

版权

1 环境配置
2 服务部署
2.1 模型转换
2.1.1 在线转换
2.1.2 离线转换
2.2 TurboMind 推理+命令行本地对话
2.3 TurboMind推理+API服务
2.4 网页 Demo 演示
2.4.1 TurboMind 服务作为后端
2.4.2 TurboMind 推理作为后端
2.5 TurboMind 推理 + Python 代码集成
2.6 这么多，头秃，有没有最佳实践
2.6.1 方案实践
2.6.2 模型配置实践
3 模型量化
3.1 KV Cache 量化
3.1.1 量化步骤
3.1.2 量化效果
3.2 W4A16 量化
3.2.1 量化步骤
3.2.2 量化效果
3.3 最佳实践
参考资料
附录1：TritonServer 作为推理引擎
TritonServer环境配置
TritonServer推理+API服务
TritonServer 服务作为后端

weixin_42837310

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
LMDeploy 大模型量化部署实践学习笔记

附录1：TritonServer 作为推理引擎。2.4.1 TurboMind 服务作为后端。2.4.2 TurboMind 推理作为后端。2.3 TurboMind推理+API服务。TritonServer推理+API服务。TritonServer 服务作为后端。2.6 这么多，头秃，有没有最佳实践。3.1 KV Cache 量化。2.4 网页 Demo 演示。3.2 W4A16 量化。2.1.1 在线转换。2.1.2 离线转换。3.1.1 量化步骤。3.1.2 量化效果。3.2.1 量化步骤。
复制链接

扫一扫

weixin_42837310 CSDN认证博客专家 CSDN认证企业博客

码龄6年

22: 原创

142万+: 周排名

21万+: 总排名

4701: 访问

: 等级

267: 积分

40: 粉丝

46: 获赞

7: 评论

57: 收藏

私信

关注

热门文章

最新评论

MMPOSE代码教学
棉花糖吖: 请问怎么在coco上训练
轻松玩转书生·浦语大模型趣味Demo 学习笔记
CSDN-Ada助手: 恭喜作者能够持续创作，第18篇博客内容也十分精彩！对于浦语大模型趣味Demo的学习笔记，我觉得作者可以在下一篇博客中加入一些自己的实践经验和心得体会，这样可以让读者更加深入地了解这个主题。希望作者能够继续分享自己的学习之路，期待更多精彩的内容！
基于 InternLM 和 LangChain 搭建你的知识库学习笔记
CSDN-Ada助手: 恭喜你写了第19篇博客！看到你用 InternLM 和 LangChain 搭建知识库的学习笔记，我真的是受益匪浅。不过我觉得你还可以进一步探索如何利用这些工具来提高学习效率，比如结合实际案例来展示它们的应用，或者分享一些使用技巧和注意事项。希望你可以继续保持创作，期待你的下一篇博客！
轻松玩转书生·浦语大模型趣味 Demo 作业
CSDN-Ada助手: 恭喜您第20篇博客的完美问世！标题“轻松玩转书生·浦语大模型趣味 Demo 作业”让我对这篇文章充满了期待。您的创作能力真是令人赞叹！对于这个有趣的 Demo 作业，我很期待能够了解更多关于浦语大模型的玩法和趣味性。希望您能够继续保持创作的激情，并分享更多关于这个领域的见解和经验。对于下一步的创作建议，或许您可以探索一些实际应用场景，如如何利用浦语大模型提高自然语言处理任务的效果，或者与其他技术的结合等等。期待您的下一篇博客，谦虚地说，我相信您的创作会更加精彩！
书生·浦语大模型全链路开源体系学习笔记
CSDN-Ada助手: 恭喜您写了第17篇博客！标题中提到的浦语大模型全链路开源体系听起来非常有趣。我很欣赏您持续创作并分享学习笔记，这对读者来说非常有价值。在下一步的创作中，或许您可以考虑深入探讨浦语大模型的具体应用场景，以及如何利用它来解决实际问题。期待您继续努力，写出更多有趣且有启发性的内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。