当使用 vllm serve 命令启动服务时,其代码执行流程主要包含以下几个关键阶段: 1. 命令行解析与参数配置 vLLM 使用 argparse 解析命令行参数,用户可以指定模型路径、量化方式、张量并行度等选项。例如: # vllm/entrypoints/serve.py 中的参数解析示例 parser = argparse.ArgumentParser(description='vLLM server') parser.add_argument('--model'