第五节笔记

最新推荐文章于 2024-09-11 14:42:29 发布

weixin_74050490

最新推荐文章于 2024-09-11 14:42:29 发布

阅读量442

点赞数 4

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_74050490/article/details/139652244

版权

LMDeploy使用笔记

1. 环境部署

创建开发机：使用InternStudio平台，选择Cuda12.2-conda镜像，分配10% A100*1GPU资源。
创建conda环境：推荐在InternStudio上创建名为lmdeploy的环境。
安装LMDeploy：激活conda环境后，使用pip install lmdeploy[all]==0.3.0安装。

2. 模型对话

了解Huggingface和TurboMind：Huggingface是深度学习模型托管社区，TurboMind是LMDeploy的推理引擎。
下载模型：可以从InternStudio或OpenXLab平台下载。
使用Transformer库运行模型：通过编写Python脚本pipeline_transformer.py进行模型对话。
使用LMDeploy与模型对话：通过命令行直接与模型交互。

3. 模型量化

了解量化概念：量化用于减少模型大小和提高推理速度。
设置KV Cache缓存大小：通过调整--cache-max-entry-count参数优化显存使用。
使用W4A16量化：通过lmdeploy lite auto_awq命令实现模型量化。

4. LMDeploy服务

启动API服务器：使用lmdeploy serve api_server命令启动。
命令行客户端连接：通过lmdeploy serve api_client与API服务器交互。
网页客户端连接：使用Gradio作为前端，通过lmdeploy serve gradio启动网页客户端。

5. Python代码集成

集成运行1.8B模型：编写pipeline.py脚本，使用LMDeploy的pipeline模块。
向TurboMind后端传递参数：通过TurbomindEngineConfig类设置参数。

6. 拓展部分

运行视觉多模态大模型llava：使用pipeline_llava.py脚本进行推理。
运行第三方大模型：LMDeploy支持多种第三方模型。
比较推理速度：编写脚本benchmark_transformer.py和benchmark_lmdeploy.py比较Transformer库和LMDeploy的推理速度。

课后作业

完成homework.md中的任务。

注意事项

确保使用推荐的Cuda版本以避免兼容性问题。
在量化和设置缓存大小时，注意显存占用和推理速度的平衡。
使用SSH端口转发访问远程API服务器。

weixin_74050490

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
第五节笔记

lmdeploy。
复制链接

扫一扫

weixin_74050490 CSDN认证博客专家 CSDN认证企业博客

码龄2年

14: 原创

145万+: 周排名

11万+: 总排名

4305: 访问

: 等级

210: 积分

57: 粉丝

70: 获赞

0: 评论

73: 收藏

私信

关注

热门文章

最新评论

TiDB：一个开源的分布式数据库解决方案
CSDN-Ada助手: 恭喜你开始博客创作！标题"TiDB：一个开源的分布式数据库解决方案"引人入胜，我对你的主题选择非常欣赏。你对TiDB这一开源分布式数据库解决方案的介绍令人信服，同时也引发了我对该技术的进一步探索兴趣。在下一步的创作中，我建议你可以更深入地探讨TiDB的优势和应用案例。你可以分享一些具体的使用经验，或者对于TiDB在大规模分布式环境中的性能表现进行进一步分析。此外，与其他数据库解决方案进行比较，讨论TiDB的优势和局限性也是一个很好的创作方向。继续努力，希望你能坚持写作，并分享更多有价值的内容。期待你未来的博客更新，谦虚的语气和深入的研究会为你的读者带来更多启发。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。