利用vLLM进行开源大模型本地部署（待继续刷新）

baidu_20834545

已于 2024-05-27 15:40:04 修改

阅读量694

点赞数 8

文章标签：人工智能语言模型自然语言处理

于 2024-04-25 14:49:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_20834545/article/details/138185338

版权

关于vllm

官方网址: https://vllm.ai
官方 github 地址：https://github.com/vllm-project/vllm
支持的模型：Supported Models — vLLM

机器环境

系统：linux ubuntu
GPU：RTX 4090D(24GB) * 1（单卡）
miniconda：conda3
python：3.9/3.10

本地部署操作步骤（部署Meta-Llama3-8b）：

下载模型到linux机器，可以参考开源大模型（LLM）下载-CSDN博客
设置conda环境（新建conda环境，并激活）

conda create -n llama3-8b python=3.9 -y
conda activate llama3-8b

3. 安装vllm： pip install vllm

4. 运行模型（注意模型参数大的话，需要更大内存的gpu，否则本地运行不起来）

python -m vllm.entrypoints.openai.api_server --model /root/autodl-tmp/Meta-Llama3-8b --trust-remote-code --port 6006

其中/root/autodl-tmp/Meta-Llama3-8b 是模型所在的文件夹路径

关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
利用vLLM进行开源大模型本地部署（待继续刷新）

通过vLLM本地部署开源大模型
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。