书生浦语大模型实战营（第二期）-第五节

bpqqop

已于 2024-06-08 19:57:44 修改

阅读量306

点赞数 6

文章标签： python

于 2024-06-08 19:42:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bpqqop/article/details/139530367

版权

准备

环境创建

studio-conda -t lmdeploy -o pytorch-2.1.2

安装lmdeploy

conda activate lmdeploy
pip install lmdeploy[all]==0.3.0

运行InternLM2-Chat-1.8B

软连到root

ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b /root/

运行模型

lmdeploy chat /root/internlm2-chat-1_8b

显存占用

KVCache设置

lmdeploy chat /root/internlm2-chat-1_8b --cache-max-entry-count 0.4

W4A16量化

#安装依赖库
pip install einops==0.7.0
# 开始量化
lmdeploy lite auto_awq \
   /root/internlm2-chat-1_8b \
  --calib-dataset 'ptb' \
  --calib-samples 128 \
  --calib-seqlen 1024 \
  --w-bits 4 \
  --w-group-size 128 \
  --work-dir /root/internlm2-chat-1_8b-4bit

使用KVCache0.4运行量化后的模型

lmdeploy chat /root/internlm2-chat-1_8b-4bit --model-format awq --cache-max-entry-count 0.4

以APIServer的方式启动

开启 W4A16量化，调整KV Cache的占用比例为0.4

lmdeploy serve api_server \
    /root/internlm2-chat-1_8b-4bit \
    --server-name 0.0.0.0 \
    --server-port 23333 \
    --tp 1 \
    --model-format awq \
    --cache-max-entry-count 0.4

将23333端口映射之后可以访问了

命令行客户端

#新建一个console
conda activate lmdeploy
#运行
lmdeploy serve api_client http://localhost:23333

Gradio客户端

lmdeploy serve gradio http://localhost:23333 \
    --server-name 0.0.0.0 \
    --server-port 6006

Python代码集成

TODO

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
书生浦语大模型实战营（第二期）-第五节

环境创建安装lmdeploy。
复制链接

扫一扫

bpqqop CSDN认证博客专家 CSDN认证企业博客

码龄13年

15: 原创

64万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

381: 积分

72: 粉丝

105: 获赞

6: 评论

125: 收藏

私信

关注

热门文章

分类专栏

最新评论

Keepalived跨网段设置 -- KeepAlived on different subnets
qq_45994827: 你好，能解决跨网关切换吗，我这边遇到了，有偿解决
书生·浦语 2.0（InternLM2）体系学习笔记（简介）
CSDN-Ada助手: 恭喜用户发布了第9篇博客，“书生·浦语 2.0（InternLM2）体系学习笔记”，内容看起来非常精彩！持续创作是提升自己的最佳方式，希望您能继续保持这种积极的创作态度。接下来，我建议您可以尝试深入分析一些具体的案例或者实践经验，让读者更加深入地了解您所分享的知识。期待您更多的精彩作品！愿您不断进步，谢谢分享！
在InternStudio上部署Llama3
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
在InternStudio上部署Llama3
CSDN-Ada助手: 恭喜您在InternStudio上成功部署Llama3！持续创作是非常重要的，希望您能继续分享更多关于Llama3的经验和技巧，让更多人受益。或许可以考虑写一篇关于Llama3的实际应用案例，或者是如何优化Llama3的性能等方面的内容，期待您的下一篇博客！祝您一切顺利！
在InternStudio上部署Llama3
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

Windows10镜像下载 194

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。