第5节LMDeploy 大模型量化部署实践：作业

森说

已于 2024-02-04 13:42:16 修改

阅读量469

点赞数 8

分类专栏：大模型文章标签：笔记

于 2024-01-14 17:13:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_75085274/article/details/135583793

版权

大模型专栏收录该内容

11 篇文章 0 订阅

订阅专栏

量化

我们这里使用第4节的个人助手进行量化，我先找到其路径在这里插入图片描述

KV Cache 量化

复制一些文件

cp /root/share/temp/datasets/c4/calib_dataloader.py  .local/lib/python3.10/site-packages/lmdep
loy/lite/utils/

cp -r /root/share/temp/datasets/c4/ /root/.cache/huggingface/datasets/

在这里插入图片描述
接下来改写一下这个py文件

然后计算minmax

lmdeploy lite calibrate \
  --model  /root/personal_assistant/work_dirs/hf_merge \
  --calib_dataset "c4" \
  --calib_samples 128 \
  --calib_seqlen 2048 \
  --work_dir ./quant_output

在这里插入图片描述
之后先转换模型

lmdeploy convert internlm-chat-7b  /root/personal_assistant/work_dirs/hf_merge/

在这里插入图片描述
然后把那个文件夹复制过来

然后获取参数

# 通过 minmax 获取量化参数
lmdeploy lite kv_qparams \
  --work_dir ./quant_output  \
  --turbomind_dir workspace/triton_models/weights/ \
  --kv_sym False \
  --num_tp 1

在这里插入图片描述
最后修改配置

W4A16 量化

第一步同上，第二步

# 量化权重模型
lmdeploy lite auto_awq \
  --model  /root/personal_assistant/work_dirs/hf_merge/ \
  --w_bits 4 \
  --w_group_size 128 \
  --work_dir ./quant_output

在这里插入图片描述
第三步

lmdeploy convert  internlm-chat-7b ./quant_output \
    --model-format awq \
    --group-size 128 \
    --dst_path ./workspace_quant

在这里插入图片描述

部署

运行chat命令

lmdeploy chat turbomind ./workspace

在这里插入图片描述
下面进行对话啦

哈哈，成功了

最后我们生成一个300字的故事
在这里插入图片描述

关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

森说 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

117万+: 周排名

14万+: 总排名

1万+: 访问

: 等级

418: 积分

188: 粉丝

256: 获赞

8: 评论

280: 收藏

私信

关注

热门文章

分类专栏

光流估计 3篇
大模型 11篇

最新评论

从零实现无监督光流pipline（2）：训练代码，损失函数代码
CSDN-Ada助手: 恭喜作者发布了第16篇博客！看到您分享了关于无监督光流pipline的训练代码和损失函数代码，真是令人期待。希望您能继续坚持创作，不断分享您的心得体会和技术经验。下一步，或许可以考虑对模型性能进行更深入的分析，或者分享一些实际应用场景的案例研究。期待您的更多精彩内容！
PWC-Net-Paddle复现（2）：模型部分
CSDN-Ada助手: 恭喜你写了第13篇博客！看了你的标题，我对你的持续创作非常佩服。你的文章内容真实可贵，对于PWC-Net-Paddle的模型部分进行复现，一定对读者有很大的帮助。不过，我想提个谦虚的建议，下一步你可以尝试深入探讨模型的优化方法或者与其他模型进行对比实验，以便读者更全面地了解该模型的优势和局限性。期待你未来更多的博客，继续加油！
合集。。。。
CSDN-Ada助手: 恭喜博主撰写了第12篇博客！合集的标题让人期待着内容的丰富多样。您的坚持与创作热情让人钦佩，每篇博客都让读者们受益匪浅。希望您能继续保持这样的创作势头，为读者带来更多精彩的内容。或许下一步，您可以考虑加入一些实用的案例分析或个人经验分享，以丰富读者们的视野。再次祝贺您，并期待着您未来更多的创作！
PWC-Net-Paddle复现（1）：数据部分
CSDN-Ada助手: 恭喜您写下了第9篇博客！标题看起来非常有趣，我迫不及待想读到关于PWC-Net-Paddle复现的内容了。您的持续创作精神值得称赞。希望您能在接下来的博客中继续深入探讨PWC-Net-Paddle的实现细节，并分享一些个人经验和发现。也许您可以考虑添加一些关于数据预处理和模型评估的内容，这将进一步丰富读者的知识。期待您的下一篇博客！
第5节LMDeploy 大模型量化部署实践：笔记
CSDN-Ada助手: 恭喜您写了第7篇博客！看到您对LMDeploy 大模型量化部署实践的笔记，感觉收获颇丰。希望您能继续保持创作的热情和耐心，分享更多的经验和见解。或许下一步可以考虑分享一些案例分析或者实际应用中的挑战与解决方案，让读者更加深入地了解这方面的知识。期待您的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。