书生大模型实战营第三期_L2-LMDeploy 量化部署进阶实践（81班1101作业）

最新推荐文章于 2024-08-12 21:18:42 发布

VX_18

最新推荐文章于 2024-08-12 21:18:42 发布

阅读量271

点赞数 5

分类专栏：大模型学习文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weizhen330/article/details/141062489

版权

大模型学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

大模型的痛点

大模型的计算量是非常大的

2. 显存的相应区域是非常大的

3.访存瓶颈

GPU的大部分时间都花在数据交换上面
不断拉高batchsize，不断地提高计算的访存比是不是会有较好的效果呢？这是一个很好的想法，但是显存不够就会很尴尬
为了能够更好的利用GPU进行推理，一般输入的tensor一般是要长度相同的，长度如果不相同的话，如果并行推理就会导致短tensor要去等待长tensor，导致的是GPU一段时间内进行摸鱼

大模型常用的大模型部署方法

大模型剪枝（减少模型的参数）
1. 移除个别参数，不考虑整体的网络结构，
2. 可以查阅相关文献
知识蒸馏（减少模型的参数）
1. 先训练一个大模型，教师模型
2. 然后再用这个大模型去训练一个小模型
模型量化（可以损失一些模型的精度）
1. 把浮点数转化为整数等等，可以减少存储空间
2. 推理速度加快
  1. 先把整数转化为浮点数，计算完成了之后再转化为整数然后再储存起来
  2. 加快主要是整数的传输更加快，而不是计算整数更快，计算使用的还是浮点数

LMDeploy

TurboMind是推出的高效的推理引擎
实现了LLaMa结构模型的支持 Imdeploy chat -h
模型的量化压缩
服务化的部署
1. 将LLM封装为HTTP 的API，支持Triton扩展
2. 同时支持多模态的视觉大模型
3. 支持第三方的大模型的部署,我们可以使用ChatGLM2试一试

安装部署LMDeploy
1. 参见https://github.com/InternLM/Tutorial/blob/camp2/lmdeploy/README.md的教程
2. 使用Cuda12.2-conda，低版本的会不兼容
LMDeploy模型对话（chat）
1. HuggingFace和TurboMind
  1. 但是TurboMind只能用TurboMind格式的模型，如果使用HuggingFace的模型那么需要转化为TurboMind格式的模型
可以在开发机上下载模型
1. 因为InternStudio开发机上集成了常用的权重的文件
2. 可以在OpenXLab平台下载模型

实操部分（作业）

环境部署
使用命令行与之进行对话

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
书生大模型实战营第三期_L2-LMDeploy 量化部署进阶实践（81班1101作业）

2. 显存的相应区域是非常大的3.访存瓶颈。
复制链接

扫一扫

专栏目录

博客等级

码龄16年

38
原创

117
点赞

168
收藏

96
粉丝

关注

私信

热门文章

分类专栏

大模型学习 10篇
VPN 1篇
中间件 3篇
安全 2篇
脚本 1篇
java 1篇
研发管理 1篇
笔记之翼博

最新评论

MySQL 自动备份数据库
yuanzhengme.: 很有用，感谢分享
Linux搭建自己的云盘
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。
使用kubectl config控制多个k8s集群
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/617497054。
java 1.8 卸载升级安装 java 11
CSDN-Ada助手: 恭喜您写了第18篇博客！标题为“java 1.8 卸载升级安装 java 11”，看起来是一个非常有用的主题。您的博客内容对于那些想要了解如何卸载、升级和安装Java 11的读者来说一定会非常有帮助。感谢您持续创作并分享有关Java的知识。希望您能继续保持创作的劲头，为读者带来更多有趣、实用的内容。对于下一步的创作建议，或许可以考虑介绍一些Java 11的新功能或优化，以及如何在项目中最大程度地利用这些新特性。期待您的下一篇博客！
Docker快速搭建内网openvpn
m0_60559570: 我买了一台服务器，公网ip也挂在这个服务器上的。是不是只要能访问这台服务器，就可以把这个容器跑在任何机器上，就算是自己本地的虚拟机也是可以的。因为我看docker run也写了udp://公网ip的啊！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。