嘿,技术迷们!今天咱们来聊聊最近在AI界引起轩然大波的GPT-4.5。这货上线一天就成了群嘲的对象,说是彻头彻尾失败了,OpenAI已经陷入了严重的困境,甚至失去了他们的护城河。😱
OpenAI的新尝试与Ilya的预言
自从OpenAI发布了GPT-4.5之后,Ilya的一句话再次引起了大家的关注:“预训练已经达到极限,推理Scaling才是未来有希望的范式。”看来GPT-4.5的表现确实让这句话显得更加金贵了。
虽然GPT-4.5在某些方面有所改进,比如变得更加合作、更具创造性和减少了幻觉,但在基准测试上并没有显著提升。这意味着它在推理能力上并没有增强。🤔
性能对比:惨不忍睹
从各方评测来看,GPT-4.5在多个评估中表现不佳,甚至比不上自家的前代产品GPT-4o。特别是在性价比方面,GPT-4.5更是被批评为“又贵又差”。一位AI初创公司的CEO直言,在他们心目中最实用的评估基准Aider Polyglot上,GPT-4.5比DeepSeek-V3贵了500倍,但性能却更差。💸
深度分析:问题出在哪里?
有人猜测,GPT-4.5可能并没有经过太多的监督微调,因为它本来是打算作为未来模型的基础或教师模型使用的。另一个可能是数据混合上的问题,因为这次采用了全新的训练机制,可能存在某种“成长痛”。
不过,最令人担忧的是,OpenAI内部许多能够解决这些问题的人才已经离开了公司。这对OpenAI来说无疑是个沉重的打击。😢
市场反应与未来展望
与此同时,国内的DeepSeek连续6天给人们带来了开源暴击,R1模型直接减价75%,这让OpenAI的压力更大了。在DeepSeek、xAI Grok 3、Anthropic等竞争对手的前后夹击下,OpenAI这位昔日明星似乎风光不再。🌟
尽管如此,OpenAI首席研究官Mark Chen依然乐观地认为,GPT-4.5证明了模型在规模上的Scaling还没有达到极限,并且代表着向下一个数量级的发展阶段迈进了一步。
结语
不管怎样,这场AI界的较量还远未结束。OpenAI能否扭转局势,重新找回自己的护城河?让我们拭目以待吧!
如果你对这篇文章感兴趣,或者有不同的见解,欢迎在评论区留言分享你的想法哦!😊