大模型代码编写能力（尤其是长代码生成）的排名表格

最新推荐文章于 2025-03-28 10:11:03 发布

认知计算茂森

最新推荐文章于 2025-03-28 10:11:03 发布

阅读量499

点赞数 9

分类专栏：让你无痛入门大模型算法文章标签：语言模型

神经美学-茂森

本文链接：https://blog.csdn.net/qq_37148940/article/details/146180062

版权

让你无痛入门大模型算法专栏收录该内容

41 篇文章

订阅专栏

根据参考资料中的评测结果和行业动态，以下是大模型代码编写能力（尤其是长代码生成）的排名表格，按综合能力由强到弱排序：

排名	模型名称	开发者/机构	代码能力优势描述	长代码支持能力
1	GPT-4	OpenAI	综合代码生成能力最强，支持复杂逻辑和长上下文，HumanEval等基准测试持续领先	支持超长上下文（128k tokens）
2	text-davinci-003	OpenAI	代码生成准确率高，尤其在算法实现和数据结构设计上表现突出	适合中等长度代码（约4k tokens）
3	DeepSeek-MoE-16b	深度求索（中国）	国产最强代码模型，LiveCodeBench榜单前三，推理效率高且支持完整项目级代码生成	优化长代码生成架构（支持10k+ tokens）
4	Gemini 2.0 Pro	Google	全栈代码生成能力，可一次性生成包含数据结构和算法的完整代码	支持长代码逻辑连贯性（约8k tokens）
5	Qwen2.5-Coder	阿里达摩院	中文代码生成优化，支持Python/Java等多语言，在复杂业务逻辑场景表现优异	长代码上下文理解（32k tokens）
6	Claude 3.5	Anthropic	代码可读性强，注释生成和错误处理能力突出	支持中等长度代码（约16k tokens）
7	Codex 2.5B	OpenAI	经典代码生成模型，在API调用和代码补全场景仍具优势	适合短代码片段（2k tokens以内）
8	GLM-4	智谱AI	中文注释生成能力优秀，支持代码重构和优化	中等长度代码（8k tokens）
9	o1-mini	未明确开发者	轻量级代码模型，在快速原型开发场景效率高	短代码生成（1k tokens以内）
10	文心一言4.0	百度	中文业务逻辑代码生成优化，适合Web开发场景	中等长度代码（约4k tokens）