为什么本地部署DeepSeek选择7B模型

最新推荐文章于 2025-04-21 13:37:05 发布

SayForLin

最新推荐文章于 2025-04-21 13:37:05 发布

阅读量1.1k

点赞数 12

文章标签：人工智能

本文链接：https://blog.csdn.net/SayForLin/article/details/145582004

版权

不多说，上图表：

来源：DeepSeek官方数据（deepseek-ai/DeepSeek-R1）

可以看到，7B模型的数据大多数超出8B，而大小还小一点，所以选择是当然的。

Model	AIME 2024 pass@1	AIME 2024 cons@64	MATH-500 pass@1	GPQA Diamond pass@1	LiveCodeBench pass@1	CodeForces rating
GPT-4o-0513	9.3	13.4	74.6	49.9	32.9	759
Claude-3.5-Sonnet-1022	16.0	26.7	78.3	65.0	38.9	717
o1-mini	63.6	80.0	90.0	60.0	53.8	1820
QwQ-32B-Preview	44.0	60.0	90.6	54.5	41.9	1316
DeepSeek-R1-Distill-Qwen-1.5B	28.9	52.7	83.9	33.8	16.9	954
DeepSeek-R1-Distill-Qwen-7B	55.5	83.3	92.8	49.1	37.6	1189
DeepSeek-R1-Distill-Qwen-14B	69.7	80.0	93.9	59.1	53.1	1481
DeepSeek-R1-Distill-Qwen-32B	72.6	83.3	94.3	62.1	57.2	1691
DeepSeek-R1-Distill-Llama-8B	50.4	80.0	89.1	49.0	39.6	1205
DeepSeek-R1-Distill-Llama-70B	70.0	86.7	94.5	65.2	57.5	1633