LiveCodeBench 技术文档

最新推荐文章于 2025-03-03 15:44:13 发布

巫子想

最新推荐文章于 2025-03-03 15:44:13 发布

阅读量1.4k

点赞数 7

本文链接：https://blog.csdn.net/gitblog_01238/article/details/143043025

版权

首先，您需要克隆 LiveCodeBench 的 GitHub 仓库到本地：

git clone https://github.com/LiveCodeBench/LiveCodeBench.git
cd LiveCodeBench

我们推荐使用 poetry 来管理项目的依赖。您可以通过以下命令安装 poetry 并安装项目的依赖：

pip install poetry
poetry install

默认情况下，vllm 不会被安装。如果您需要安装 vllm，可以使用以下命令：

poetry install --with with-gpu

LiveCodeBench 提供了代码生成的功能。您可以使用 vllm 进行推理，默认情况下，我们使用 tensor_parallel_size=${num_gpus} 来并行化推理。您可以通过 --tensor_parallel_size 标志来配置并行化的 GPU 数量。

运行代码生成的命令如下：

python -m lcb_runner.runner.main --model {model_name} --scenario codegeneration

您还可以使用 --use_cache 标志来缓存生成的输出，使用 --continue_existing 标志来使用现有的转储结果。如果您希望使用本地路径中的模型，可以额外提供 --local_model_path 标志，并指定模型的路径。

我们计算 pass@1 和 pass@5 指标来评估模型。您可以通过添加 --evaluate 标志来运行评估：

python -m lcb_runner.runner.main --model {model_name} --scenario codegeneration --evaluate

运行自修复时，您需要提供额外的 --codegen_n 标志，该标志映射到代码生成期间生成的代码数量。此外，--temperature 标志用于解析旧的代码生成评估文件，该文件必须存在于 output 目录中。

python -m lcb_runner.runner.main --model {model_name} --scenario selfrepair --codegen_n {num_codes_codegen} --n 1

运行测试输出预测场景时，您可以简单地运行：

python -m lcb_runner.runner.main --model {model_name} --scenario testoutputprediction --evaluate

运行代码执行场景时，您可以简单地运行：

python -m lcb_runner.runner.main --model {model_name} --scenario codeexecution --evaluate

我们还支持 COT 设置：

python -m lcb_runner.runner.main --model {model_name} --scenario codeexecution --cot_code_execution --evaluate

您可以使用 lcb_runner/runner/custom_evaluator.py 直接评估自定义文件中的模型生成。文件应包含按基准问题顺序排列的模型输出列表。

python -m lcb_runner.runner.custom_evaluator --custom_output_file {path_to_custom_outputs}

输出格式如下：

[
    {"question_id": "id1", "code_list": ["code1", "code2"]},
    {"question_id": "id2", "code_list": ["code1", "code2"]}
]

要添加对新模型的支持，您可以在 lcb_runner/lm_styles.py 文件中添加新模型，并在 lcb_runner/prompts/generation.py 文件中为模型添加新的提示。

我们推荐使用 poetry 来管理项目的依赖。您可以通过以下命令安装 poetry 并安装项目的依赖：

pip install poetry
poetry install

默认情况下，vllm 不会被安装。如果您需要安装 vllm，可以使用以下命令：

poetry install --with with-gpu

通过以上步骤，您可以顺利安装并使用 LiveCodeBench 项目。