vLLM环境安装与运行实例【v0.5.4】

莽夫搞战术

已于 2024-11-27 11:07:39 修改

阅读量1.1k

点赞数 6

分类专栏：环境搭建文章标签：人工智能语言模型

于 2024-11-19 11:15:09 首次发布

本文链接：https://blog.csdn.net/yd778473278/article/details/143856895

版权

环境搭建专栏收录该内容

6 篇文章

订阅专栏

vLLM环境安装与运行实例【v0.5.4】

vLLM
vLLM环境安装
vLLM运行示例

vLLM

vLLM is a fast and easy-to-use library for LLM inference and serving.
vLLM是一个快速易用的LLM推理和服务库。
（注意：vllm使用v0.5.4版本，否则使用PyTorch报错）

vLLM环境安装

基础环境安装

环境	版本	备注
CUDA	12.1	PyTorch==2.4.0需要对应cuda==12.1
Python	3.10.4	可以通过Annaconda或者源码安装
vllm	0.5.4	使用v0.5.4版本，否则使用PyTorch报错
torch	2.4.0	PyTorch==2.4.0需要对应cuda==12.1

具体安装可参考我的另一篇文章fairseq-0.12.2多机训练环境搭建。

Python安装（可选，通过Annaconda）

conda create -n vllm python=3.10 -y
conda activate vllm

vllm为conda创建的环境名称

安装vllm

#使用v0.5.4版本，否则使用PyTorch报错
pip3 install vllm==0.5.4 -i https://pypi.tuna.tsinghua.edu.cn/simple
#如果PyTorch版本不正确，可按以下安装
pip3 install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple

vLLM运行示例

测试代码

from vllm import LLM, SamplingParams

prompts = [
    "Hello, my name is",
    "The president of the United States is",
    "The capital of France is",
    "The future of AI is",
]
sampling_params = SamplingParams(temperature=0.8, top_p=0.95)

llm = LLM(model="./opt-125m")

outputs = llm.generate(prompts, sampling_params)

for output in outputs:
    prompt = output.prompt
    generated_text = output.outputs[0].text
    print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")