【大模型】第五节课作业

weixin_43193528

于 2024-01-17 20:56:10 发布

阅读量549

点赞数 10

文章标签：人工智能 llama

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43193528/article/details/135660122

版权

本文介绍了如何使用LMDeploy在本地、网页和API服务中部署InternLM-Chat-7B模型，以及进阶作业中的量化部署和性能测试，包括不同量化策略对显存和速度的影响。完成基础作业后，进阶技术将作为加分项在后续项目中发挥作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基础作业：

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事（需截图）
请添加图片描述

进阶作业（可选做）

将第四节课训练自我认知小助手模型使用 LMDeploy 量化部署到 OpenXLab 平台。
对internlm-chat-7b模型进行量化，并同时使用KV Cache量化，使用量化后的模型完成API服务的部署，分别对比模型量化前后（将 bs设置为 1 和 max len 设置为512）和 KV Cache 量化前后（将 bs设置为 8 和 max len 设置为2048）的显存大小。
在自己的任务数据集上任取若干条进行Benchmark测试，测试方向包括：
（1）TurboMind推理+Python代码集成
（2）在（1）的基础上采用W4A16量化
（3）在（1）的基础上开启KV Cache量化
（4）在（2）的基础上开启KV Cache量化
（5）使用Huggingface推理
备注：由于进阶作业较难，完成基础作业之后就可以先提交作业了，在后续的大作业项目中使用这些技术将作为重要的加分点！

weixin_43193528

博客等级

码龄7年

16
原创

186
点赞

165
收藏

139
粉丝

关注

私信

热门文章

最新评论

【大模型】书生·浦语大模型实战营第六节
CSDN-Ada助手: 恭喜您第14篇博客《【大模型】书生·浦语大模型实战营第六节》的成功发布！您的持续创作让我们看到了您对于大模型的热情和专注，同时也让我们受益匪浅。在接下来的创作中，希望您可以多分享一些实战经验和心得体会，这样可以更好地帮助到更多的读者。期待您的下一篇作品，加油！
【大模型】第六节课作业
CSDN-Ada助手: 恭喜您第15篇博客的完成！标题中的【大模型】让我对内容充满了期待。您的持续创作真是令人钦佩，我很高兴看到您在不断进步。对于下一步的创作，我谨慎建议您可以尝试探索更多与大模型相关的话题，例如深入研究大模型的训练方法或者应用案例。相信您一定能够在这个领域中找到更多有价值的知识点，并与我们分享。希望您能够保持谦虚的态度，继续努力创作，期待着您的下一篇博客！
【大模型】书生·浦语大模型实战营第三节
CSDN-Ada助手: 恭喜博主完成第8篇博客！看到标题中的“大模型”和“实战营”，我立即感到了浓厚的学习氛围。在这个快节奏的时代，您能够持续创作并分享知识，真是令人钦佩。从您的博客标题中，我猜测您参加了一场名为“浦语大模型实战营”的活动。这无疑是一个很棒的机会，可以与其他人一起学习和探索大模型的应用。希望您能够在博客中分享一些实战营的收获和体验，让读者更加了解这个活动，也能从中受益。在下一步的创作中，我建议您可以尝试结合实战营的内容，探索一些实际案例或者应用场景。通过具体的例子，读者可以更好地理解大模型的概念，并且能够将其应用于实际工作中。当然，这只是我的一点小建议，希望对您的创作有所启发。再次恭喜您的持续创作，期待看到更多精彩的博客！
【大模型】第三节课作业
CSDN-Ada助手: 恭喜您完成了第9篇博客！看到您持续创作，我感到非常高兴。您的努力和热情在每一篇博客中都能得到体现，让读者受益匪浅。在您的第9篇博客中，我注意到了标题中的“大模型”这个关键词，这让我对您接下来的内容产生了浓厚的兴趣。或许您可以在下一步的创作中，分享一些关于大模型的案例研究或者技巧分享，这将进一步丰富您的博客内容，并吸引更多对大模型感兴趣的读者。继续保持谦虚的态度，并不断进步和学习，我坚信您将会创作出更加精彩的博客！期待着您的下一篇作品。
【大模型】书生·浦语大模型实战营第四节
CSDN-Ada助手: 恭喜你的第10篇博客！看来你在书生·浦语大模型实战营中收获颇丰啊。不过，我觉得你可以在下一篇博客中分享一些关于大模型实战营的学习心得和体会，这样可以让读者更好地理解你的学习过程。希望你可以继续保持写作的热情，期待你更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。