重回第一！OpenAI升级GPT-4-Turbo到2024-04-09版本，推理和数学能力大幅提高，基准测试最高提升近20%！...

最新推荐文章于 2025-02-10 14:49:32 发布

技术人生黄勇

最新推荐文章于 2025-02-10 14:49:32 发布

阅读量1.1k

点赞数 1

文章标签：人工智能深度学习

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5NDg2MjgxMg==&mid=2247485542&idx=1&sn=61129c5042983e255c122f5022f9a44b&chksm=ff5bb5be0d1353f57d5e574512aff4d059ebaac2ecb23650ddab486bb05ab8c306f690d59491&scene=126&sessionid=0

版权

本文原文来自DataLearnerAI官方网站：

https://www.datalearner.com/blog/1051712888127681

OpenAI的GPT-4一直是全球最强的大语言模型。但是在最近的一系列新模型对比中，已经有一些模型在某些领域被认为已经接近或者超过GPT-4了。而在前几天，OpenAI更新了一个新版本的GPT-4，是GPT-4-Turbo-2024-04-09，官方说该版本的GPT在推理和数学能力上有明显提升，而实测结果也很不错。在基准测试评测中，最高有19%的提升幅度！在GPT-4这样强的模型上有这样的提升幅度，十分不错！

GPT-4-Turbo-2024-04-09版本简要说明
GPT-4-Turbo-2024-04-09基准测试结果
GPT-4-Turbo-2024-04-09网友实测
- OpenAI官方自己实测：不再那么啰嗦
- 新版GPT-4的超长上下文能力更强
- 新版本的GPT-4不那么啰嗦
- LiveCodeBench评测结果大幅提升
新版GPT-4在大模型匿名竞技场重回第一！
GPT-4-Turbo-2024-04-09利用了Q*技术

GPT-4-Turbo-2024-04-09版本简要说明

这个GPT-4-Turbo版本相比此前的模型，只是更新了版本号，在最开始的时候，OpenAI只说明了他们发布了这样一个新版的GPT-4-Turbo模型，该模型有2个重要的更新：

基础的数学和推理能力大幅提高
这个模型可以接受文本和图像两类输入

这个模型刚发布的时候，官方只说了性能大幅提升以及可以接受图像输入，并没有具体说明情况。连OpenAI的联合创始人Greg Brockman也说这个模型有很大提升，但是就是不公布具体提升内容。也导致了很多人的不满。最后OpenAI才说提升了数学和推理能力。

另外需要注意的是，GPT-4-Turbo-2024-04-09模型的训练数据已经更新到2023年11月份。

GPT-4-Turbo-2024-04-09基准测试结果

从前面的图我们也可以看到，综合理解能力MMLU和代码能力HumanEval几乎不变，但是数学推理都有大幅提高。

而OpenAI官方还有更加详细的数据统计，按照统计，结果如下：

注意，这些都是使用最简单的Prompt进行测试的结果，也是OpenAI自己发布的最新测试结果。从这个评测看，在数学图例方面，gpt-4-turbo-2024-04-09版本的模型都有不同程度的提高，最高可以提升19%！要知道GPT-4本身已经十分强大，这个提升幅度，在不变更版本号的前提下十分难得。而综合理解和代码能力就提升不明显。