GPT-4.5被DeepSeek 500倍吊打！基准测试全班垫底，OpenAI痛失护城河

东方佑

已于 2025-03-01 16:44:24 修改

阅读量388

点赞数 6

分类专栏：量子变法文章标签：人工智能

于 2025-03-01 16:44:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32759777/article/details/145950016

版权

量子变法专栏收录该内容

446 篇文章

订阅专栏

嘿，技术迷们！今天咱们来聊聊最近在AI界引起轩然大波的GPT-4.5。这货上线一天就成了群嘲的对象，说是彻头彻尾失败了，OpenAI已经陷入了严重的困境，甚至失去了他们的护城河。😱

OpenAI的新尝试与Ilya的预言

自从OpenAI发布了GPT-4.5之后，Ilya的一句话再次引起了大家的关注：“预训练已经达到极限，推理Scaling才是未来有希望的范式。”看来GPT-4.5的表现确实让这句话显得更加金贵了。

虽然GPT-4.5在某些方面有所改进，比如变得更加合作、更具创造性和减少了幻觉，但在基准测试上并没有显著提升。这意味着它在推理能力上并没有增强。🤔

性能对比：惨不忍睹

从各方评测来看，GPT-4.5在多个评估中表现不佳，甚至比不上自家的前代产品GPT-4o。特别是在性价比方面，GPT-4.5更是被批评为“又贵又差”。一位AI初创公司的CEO直言，在他们心目中最实用的评估基准Aider Polyglot上，GPT-4.5比DeepSeek-V3贵了500倍，但性能却更差。💸

深度分析：问题出在哪里？

有人猜测，GPT-4.5可能并没有经过太多的监督微调，因为它本来是打算作为未来模型的基础或教师模型使用的。另一个可能是数据混合上的问题，因为这次采用了全新的训练机制，可能存在某种“成长痛”。

不过，最令人担忧的是，OpenAI内部许多能够解决这些问题的人才已经离开了公司。这对OpenAI来说无疑是个沉重的打击。😢

市场反应与未来展望

与此同时，国内的DeepSeek连续6天给人们带来了开源暴击，R1模型直接减价75%，这让OpenAI的压力更大了。在DeepSeek、xAI Grok 3、Anthropic等竞争对手的前后夹击下，OpenAI这位昔日明星似乎风光不再。🌟

尽管如此，OpenAI首席研究官Mark Chen依然乐观地认为，GPT-4.5证明了模型在规模上的Scaling还没有达到极限，并且代表着向下一个数量级的发展阶段迈进了一步。

结语

不管怎样，这场AI界的较量还远未结束。OpenAI能否扭转局势，重新找回自己的护城河？让我们拭目以待吧！

如果你对这篇文章感兴趣，或者有不同的见解，欢迎在评论区留言分享你的想法哦！😊

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

东方佑 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。