第5节LMDeploy作业

qq_gn

已于 2024-03-18 22:46:55 修改

阅读量420

点赞数 10

文章标签：笔记

于 2024-01-18 22:26:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46052444/article/details/135685729

版权

基础作业：

选择使用API server的方式写300字的小故事：

1.转发端口后使用GET /v1/models查看id

2 在POST /v1/chat/completions中填写id

3.执行后返回结果：

进阶作业：

1.对于上节课作业xtuner微调后的小助手模型进行量化：W4A16

2对InternLM-chat-7b量化

（1）KVcache量化

教程中使用c4数据集量化有些读取数据上的异常，使用ptb数据集

lmdeploy lite calibrate   --model  /root/share/temp/model_repos/internlm-chat-7b/   --calib_dataset "ptb"   --calib_samples 128   --calib_seqlen 2048   --work_dir ./quant_output

# 通过 minmax 获取量化参数
lmdeploy lite kv_qparams \
  --work_dir ./quant_output  \
  --turbomind_dir workspace/triton_models/weights/ \
  --kv_sym False \
  --num_tp 1

将quant_policy设置为4打开KV int8开关

启动推理

可以看到占到的显存为：14758MB

（2）W4A16量化

占到的显存仅仅为：5824MB，比KVcache小的多

关注

10
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
第5节LMDeploy作业

2 在POST /v1/chat/completions中填写id。1.转发端口后使用GET /v1/models查看id。
复制链接

扫一扫

qq_gn CSDN认证博客专家 CSDN认证企业博客

码龄5年

16: 原创

113万+: 周排名

11万+: 总排名

7682: 访问

: 等级

269: 积分

89: 粉丝

100: 获赞

7: 评论

105: 收藏

私信

关注

热门文章

最新评论

InternLM大模型实战营作业集合
CSDN-Ada助手: 恭喜您发布了第16篇博客“InternLM大模型实战营作业集合”！看到您持续创作，不断分享经验和学习心得，真是令人钦佩。希望您能继续保持这样的创作热情，分享更多有价值的内容。或许在下一篇博客中，可以分享一些实战经验和技巧，让更多人受益。期待您的下一篇作品！
OpenXlab应用部署经验
CSDN-Ada助手: 恭喜您发布了第14篇博客“OpenXlab应用部署经验”，分享了宝贵的经验和知识。继续保持创作的热情和努力，让更多的人受益于您的分享。建议您在未来的创作中可以尝试结合更多实际案例或者深入分析，让内容更加丰富和有深度。期待您的更多精彩作品！
InternLM大模型实战营基础作业和笔记合集
CSDN-Ada助手: 恭喜您撰写第13篇博客！标题“InternLM大模型实战营基础作业和笔记合集”听起来非常精彩。您的持续创作令人钦佩，文章内容也一定受到了读者的高度关注。接下来，我建议您可以考虑深入探讨一些与InternLM大模型实战营相关的实际案例，或者分享一些您在实战中遇到的挑战和解决方案。这样的创作能够进一步拓展读者的视野，同时也让我们从中获益良多。期待您未来更多的博客作品！
第6节OpenCompass 作业
CSDN-Ada助手: 恭喜您完成了第12篇博客！每一次的创作都是一次进步和成长的机会。在这篇《第6节OpenCompass 作业》中，您似乎展示了对OpenCompass的理解和应用。接下来，我建议您可以进一步深入探索OpenCompass的特性和功能，并结合实际案例或个人见解，给读者提供更多实用的指导和建议。希望您能继续保持创作的热情，期待您未来更多精彩的博客！
第5节LMDeploy作业
CSDN-Ada助手: 尊敬的博主，恭喜您发布了第10篇博客《第5节LMDeploy作业》！您的持续创作真的让人佩服，每篇博客都充满了深入的分析和有益的信息。希望您可以继续保持这样的创作热情，也期待您能够在下一篇博客中分享更多实用的经验和技巧。加油！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。