书生·浦语大模型实战营第二期学习笔记及作业（5）

qq_39310059

已于 2024-04-16 20:45:49 修改

阅读量356

点赞数 5

文章标签：学习笔记语言模型人工智能

于 2024-04-16 20:42:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39310059/article/details/137839634

版权

视频教程链接：LMDeploy 量化部署 LLM-VLM 实践_哔哩哔哩_bilibili

github教程链接：https://github.com/InternLM/Tutorial/blob/camp2/lmdeploy/README.md

课程笔记

课程视频分为四部分:

1、大模型部署的背景、部署方法、IMDEI量化部署和大圆模型实践，以及实际部署中面临的挑战，包括计算量、内存开销、仿存瓶颈和用户请求不确定性等问题。

2、三种减少模型参数的方法：非结构化、结构化和知识蒸馏。

可以通过减少模型参数来提高计算效率

知识蒸馏方法来降低训练难度

模型量化可以提高计算效率，并减少模型参数所需的内存空间

3、LMdeploy核心功能

4、LMDeploy 量化部署 LLM-VLM 实践

二、作业部分

课程作业链接：https://github.com/InternLM/Tutorial/blob/camp2/lmdeploy/homework.md

1、基础作业：

完成以下任务，并将实现过程记录截图：

配置 LMDeploy 运行环境

以命令行方式与 InternLM2-Chat-1.8B 模型对话

2、进阶作业

①设置KV Cache最大占用比例为0.4，开启W4A16量化，以命令行方式与模型对话。

开启W4A16量化

设置KV Cache最大占用比例为0.4

以命令行方式与模型对话。

②以API Server方式启动 lmdeploy，开启 W4A16量化，调整KV Cache的占用比例为0.4，分别使用命令行客户端与Gradio网页客户端与模型对话。

通过以下命令启动API服务器，推理internlm2-chat-1_8b模型：

lmdeploy serve api_server \
    /root/internlm2-chat-1_8b-4bit \
    --model-format awq \
    --cache-max-entry-count 0.4 \
    --quant-policy 0 \
    --server-name 0.0.0.0 \
    --server-port 23333 \
    --tp 1

首先通过VS Code新建一个终端，用命令行客户端去连接API服务器。

新建一个VSCode终端，激活conda环境，使用Gradio作为前端，启动网页客户端。

与模型进行对话：

③使用W4A16量化，调整KV Cache的占用比例为0.4，使用Python代码集成的方式运行internlm2-chat-1.8b模型。

④使用 LMDeploy 运行视觉多模态大模型 llava gradio demo

通过浏览器访问http://127.0.0.1:7860，使用模型问答

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_39310059 CSDN认证博客专家 CSDN认证企业博客

码龄7年

7: 原创

137万+: 周排名

17万+: 总排名

5070: 访问

: 等级

176: 积分

91: 粉丝

93: 获赞

3: 评论

84: 收藏

私信

关注

热门文章

最新评论

书生·浦语大模型实战营第二期学习笔记及作业（6）
CSDN-Ada助手: 恭喜您发布了第6篇博客！看到您对书生·浦语大模型实战营第二期学习的认真总结和作业完成，让我感到十分欣慰。希望您能继续保持这种学习的热情和努力，坚持不懈地创作下去。在未来的创作中，可以尝试加入更多个人见解或心得体会，这样可以让读者更加深入地了解您的学习过程和收获。期待您更多精彩的作品，加油！
书生·浦语大模型实战营第二期学习笔记及作业（7）
CSDN-Ada助手: 恭喜作者发布了第7篇博客！看到你参加了浦语大模型实战营第二期学习，并分享了学习笔记及作业，真是非常勤奋和努力。希望你能继续坚持创作，不断提升自己的写作水平。下一步建议可以尝试更多样的题材和观点，拓宽自己的写作领域，相信你会有更多的收获和进步的！加油！
书生·浦语大模型实战营第二期学习笔记及作业（3）
CSDN-Ada助手: 恭喜用户在浦语大模型实战营第二期学习中取得了显著进步，并分享了学习笔记和作业。希望用户能够继续坚持不懈地创作并分享自己的学习心得体会，不断提升自己的写作水平和表达能力。建议用户在下一篇博客中可以尝试结合实际案例或个人经历，更加生动地展示学习成果，让读者能够更加深入地了解学习过程和收获。期待用户更多精彩的创作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生·浦语大模型实战营第二期学习笔记及作业（2）
CSDN-Ada助手: 太棒了！看到你在书生·浦语大模型实战营第二期学习笔记（2）中的收获和成果让我感到非常振奋。你对模型和智能对话模型的学习和实践让人印象深刻，而且你在准备申请网络流量分类项目方面的决心也非常值得称赞。除了学习笔记中提到的内容，我想分享一些关于微调模型的技能扩展。在微调模型时，可以尝试使用不同的预训练模型、调整学习率和增加训练数据等方法来提升模型性能。另外，对于部署模型，可以尝试使用更高级的部署技术如Docker和Kubernetes来提高效率和稳定性。希望你能继续保持热情和努力，不断探索和学习，相信你一定会取得更大的进步和成就！期待看到你更多精彩的分享和成果，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。