03 LMDeploy部署 Llama 3 模型

weixin_52386946

已于 2024-05-09 21:12:07 修改

阅读量254

点赞数 2

文章标签： llama

于 2024-05-09 21:08:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52386946/article/details/138631783

版权

1 . 部署lmdeploy

`pip install -U lmdeploy[all]`

由于先前已经下载配置好环境和下载好了模型文件，在此就不重复下载了

2. LMDeploy Chat CLI 工具

conda activate llama3
lmdeploy chat /root/model/Meta-Llama-3-8B-Instruct

3. 模型量化

lmdeploy lite auto_awq \
 /home/daoer/model/Meta-Llama-3-8B-Instruct \
--calib-dataset 'ptb' \
--calib-samples 128 \
--calib-seqlen 1024 \
--w-bits 4 \
--w-group-size 128 \
--work-dir /home/daoer/model/Meta-Llama-3-8B-Instruct_4bit

4. LMDeploy服务（serve）

通过以下命令启动API服务器，推理Meta-Llama-3-8B-Instruct模型：

lmdeploy serve api_server \
    /root/model/Meta-Llama-3-8B-Instruct \
    --model-format hf \
    --quant-policy 0 \
    --server-name 0.0.0.0 \
    --server-port 23333 \
    --tp 1

在这里插入图片描述

4.1 终端运行API

接下来连接api接口
新建一个终端

conda activate lmdeploy
# 运行命令行
lmdeploy serve api_client http://localhost:23333

在这里插入图片描述

4.2 web运行API

新建终端尝试本机web和ai交互：

# 安装gradio
pip install gradio==3.50.2
# 激活conda
conda activate lmdeploy
# 启动Gradio
lmdeploy serve gradio http://localhost:23333 \
    --server-name 0.0.0.0 \
    --server-port 6006

在这里插入图片描述

成功啦

weixin_52386946

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_52386946 CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

191万+: 周排名

19万+: 总排名

2059: 访问

: 等级

83: 积分

25: 粉丝

28: 获赞

6: 评论

22: 收藏

私信

关注

热门文章

最新评论

01 Llama3部署
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
02 XTuner 微调小助手认知
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
01 Llama3部署
CSDN-Ada助手: 恭喜您开始了博客创作之旅！部署Llama3是一个不错的主题选择，希望您能够继续分享更多有趣的技术内容。建议您在接下来的创作中，可以结合实际案例或者个人经验，让读者更易于理解和参考。加油！期待您的下一篇博客。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
01 Llama3部署
CSDN-Ada助手: 恭喜您开始了博客创作之旅！标题“01 Llama3部署”已经展现了您的专业知识和热情。希望您能继续分享更多关于Llama3部署的经验和技巧，让更多人受益。同时，建议您在后续的创作中，可以适当增加一些案例分析或实践经验，让读者更易于理解和应用。期待您的下一篇博客！祝您创作顺利！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
02 XTuner 微调小助手认知
CSDN-Ada助手: 非常感谢您分享这篇关于02 XTuner 微调小助手认知的博文！您的文章内容详实，让读者可以清晰地了解如何进行模型微调和推理验证。希望您可以继续分享更多关于深度学习和模型优化的经验和技巧。在深度学习领域，您可能会对数据增强技术感兴趣，这是一种通过对训练数据进行变换和扩充来增加数据多样性的方法，有助于提高模型的泛化能力。另外，对超参数调整和模型结构优化也是提升模型性能的关键因素，希望您可以在未来的博文中分享相关经验和技巧。祝您在深度学习领域不断进步，创作更多优质内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。