LiveCodeBench: 大型语言模型代码能力的全面无污染评估

最新推荐文章于 2025-05-08 08:26:03 发布

邹岩讳Sally

最新推荐文章于 2025-05-08 08:26:03 发布

阅读量2.5k

点赞数 24

本文链接：https://blog.csdn.net/gitblog_00776/article/details/141741330

版权

LiveCodeBench: 大型语言模型代码能力的全面无污染评估

LiveCodeBenchOfficial repository for the paper "LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code"项目地址:https://gitcode.com/gh_mirrors/li/LiveCodeBench

1. 项目介绍

LiveCodeBench 是一个专为大型语言模型（LLMs）设计的综合性、无污染评价基准。它致力于评估LLM在编码任务上的能力，涵盖从代码生成到自我修复代码执行、测试输出预测等更广泛的编程相关技能。该项目定期从LeetCode、AtCoder以及CodeForces这三大竞赛平台收集新问题，构建了一个随着时间推移不断更新的问题集，目前收录了发布于2023年5月至2024年5月期间的四百个高质量编程难题。

2. 项目快速启动

要开始使用LiveCodeBench，您首先需要克隆仓库并设置开发环境。以下是快速入门步骤：

# 克隆LiveCodeBench仓库
git clone https://github.com/LiveCodeBench/LiveCodeBench.git
cd LiveCodeBench

# 强烈推荐使用poetry管理依赖项
# 安装poetry（如果尚未安装）
curl -sSL https://install.python-poetry.org | python3 -

# 使用poetry安装项目依赖
poetry install

完成上述步骤后，您将能够运行LiveCodeBench提供的测试或参与代码评估流程。