大模型学习之书生·浦语大模型5——基于LMDeploy大模型量化部署实践

uncle_ll

已于 2024-01-18 21:07:17 修改

阅读量779

点赞数 10

分类专栏： # 书生·浦语大模型文章标签：学习 LLM 大模型持续部署

于 2024-01-16 23:57:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uncle_ll/article/details/135637903

版权

书生·浦语大模型专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在这里插入图片描述

目录

在这里插入图片描述

大模型部署背景

在这里插入图片描述

LMDeploy部署

在这里插入图片描述

量化

在这里插入图片描述

TurboMind

在这里插入图片描述

API server

在这里插入图片描述

动手实践环节

在这里插入图片描述

1.创建开发机

在这里插入图片描述

2.创建虚拟环境

在这里插入图片描述

3.服务部署

在这里插入图片描述
在线转换模型

离线转换

在这里插入图片描述

4.TurboMind推理

在这里插入图片描述

TurboMind+API服务

提供了一些API的接口
Gradio Demo演示
API server作为后端

注意这里要同时启动API server的

TurboMind推理作为后端
在这里插入图片描述

5.Benchmark

在这里插入图片描述

模型量化

模型量化以在保证精度的同时，降低空间占用以及加快推理速度。

KV Cache量化

第一步：计算minmax
第二步：通过minmax获取量化参数
第三步：修改配置文件，打开一些开关
量化效果：
性能有下降，也有提升

W4A16量化

第一步：计算minmax
第二步：量化权重模型
第三步：转换为TurboMind格式

量化效果
在这里插入图片描述

讲个故事：

参考

https://github.com/InternLM/

关注

10
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

uncle_ll

CSDN认证博客专家 CSDN认证企业博客

码龄11年

813: 原创

6730: 周排名

1694: 总排名

155万+: 访问

: 等级

1万+: 积分

4938: 粉丝

2972: 获赞

441: 评论

6278: 收藏

私信

关注

热门文章

分类专栏

最新评论

代码与财富：程序员如何利用技术优势投资金融？
2301_77775267: 优秀！关注了看了下历史文章感觉哥们儿离我不远啊
yolo图像检测数据集格式转换：xml 与 txt格式相互转换
uncle_ll: 这个错误消息表明在 Python 脚本 txtx-xml.py 的第 27 行，存在一个缩进错误。具体来说，IndentationError: unindent does not match any outer indentation level 表示该行的缩进与它所在代码块的其它行不匹配。在 Python 中，缩进是极其重要的，因为它用来表示代码块的层次结构。错误的缩进会导致程序无法正确识别代码块的开始和结束。解决步骤检查缩进：确保第 27 行的缩进与它所在代码块的其他行完全一致。查看它前后几行的缩进，并确保一致性。使用统一的缩进方式：确保整个文件中使用的是空格或制表符（通常是4个空格）来缩进，不要混用。检查前后相关代码：有时候，错误可能不在报错的那一行，而是在之前的几行。检查前后的代码，确保所有相关的代码行都有正确的缩进。
yolo图像检测数据集格式转换：xml 与 txt格式相互转换
symhxy: PS G:\yolov10\yolov10-main> & D:/BDRJ/envs/yolov10/python.exe g:/yolov10/yolov10-main/txtx-xml.py File "g:\yolov10\yolov10-main\txtx-xml.py", line 27 oneline = i.strip().split(" ") ^ IndentationError: unindent does not match any outer indentation level 这个是完整的
yolo图像检测数据集格式转换：xml 与 txt格式相互转换
uncle_ll: 报什么错把i print出来看看
yolo图像检测数据集格式转换：xml 与 txt格式相互转换
symhxy: File "g:\yolov10\yolov10-main\txtx-xml.py", line 27 oneline = i.strip().split(" ") 你好，这个报错是什么意思呢

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

uncle_ll 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。