奥特曼秀5颗草莓疯狂暗示GPT-5？匿名新模型神秘现身，数学超强！

IT界那些事儿

于 2024-08-08 17:07:31 发布

阅读量215

点赞数 1

文章标签： gpt 人工智能

原文链接：https://mp.weixin.qq.com/s/LMNIKV7xWTGK5MZsSPT5Mg

版权

【导读】奥特曼又来搞事情了！一张5颗草莓照片，让全网掀起热议狂澜。这不是明摆着暗示，神秘Strawberry项目真实存在。难道GPT-5真的要来了吗？

或许，GPT-5真的不远了。

今天，Sam Altman突然发文「我爱花园里的夏天」，并配图5颗草莓，瞬间在全网炸了锅。

而就在刚刚，OpenAI研究员Trevor Creech发文——今晚在OpenAI吃晚餐。

而盘子中间，恰好放着一颗草莓。

这一切，究竟是在疯狂暗示什么？

一张图，引发全网大猜想

网友表示，奥特曼的草莓不仅成熟了，而且已经准备好了。今晚，我们将品尝到AGI的果实。奇点有点「草莓」的味道。

化身侦探的网友，圈出那个躲在角落的第五个还未成熟的草莓。

然后，去Google了下草莓一般需要多久才能成熟——开花之后4-6周即可。

由此，他下定结论：GPT-5可能在未来4-6周内确认发布。

还有人直接搜索了2024夏天什么时候结束。

更有意思的是，误以为AI生成图像的网友在线求prompt。奥特曼本人确认，这就是我的花园。

这张照片虽看起来平平无奇，但却触发了AI社区的兴奋点。

在所有人看来，奥特曼实际上承认了关于OpenAI正在开发一个代号为「Strawberry」模型的传言，也就是期待已久的GPT-5。

网友暗示，「奥特曼一直都很喜欢草莓」

这还不够直白么，奥特曼已经确认Q*/Strawberry。

匿名新模型，GPT-5前身？

凑巧的是，Jimmy Apples今天还发现了LYSMS竞技场中，闪现一个「匿名」新模型——anonymous-chatbot。

自我介绍中，它承认是基于GPT-4架构搭建的模型，并经过微调专为聊天定制

而且经过一番测试，发现匿名聊天机器人在数学能力上，有大幅提升。

它甚至还做对了，经典难题strawberry里有几个r的问题。

下面这道题，也没有哪款模型能始终如一地给出正确答案。

但anonymous-chatbot做到了。

如果一个正六边形的短对角线为64，那么它的长对角线是多少？

答：73.9

anonymous-chatbot真正身份是？是谁做出来的？现无人知晓。

不过，一些网友已经将其往GPT-5、Q*身上靠了。正如网友所言，无论它是什么，暗示着新的东西即将要来。

一些人将其猜测为GPT-5，并非没有道理。

毕竟，OpenAI在此之前，曾把即将要发布的模型，提前放出来让大家测试，可是惊动了整个社区。

还记得GPT-4o发布之前，大模型竞技场LYSMS现身一个神秘的模型——「gpt2-chatbot」，超越了GPT-4。

直到新模型发布之后，OpenAI科学家证实了，gpt2-chatbot测试版本就是GPT-4o。

现在再回到anonymous-chatbot上，有了前车之鉴，也为网友们的猜测增加了一份确定性。

爆料人Flowers测试后，惊叹道anonymous-chatbot一次性解决了所有测试谜题。

包括「草莓测试」。

许多模型失败的逻辑推理题——「过河难题」也被轻易解决了。

本质上，还是9.9和9.11谁大的难题，anonymous-chatbot没有犯错。

匿名模型，具备了更多的类人反应。

不过，目前在https://chat.lmsys.org/模型榜中，根本找不到匿名模型。这件事真的是越来越迷了。

神秘草莓项目

「草莓项目」初次曝光，还是在上个月。

路透独家报道称，OpenAI正全力研究草莓（Strawberry）新项目，据称就是传言已久的Q*。

Q*项目最初也是由路透，在去年底首次曝光。

当时，OpenAI内部人士表示，Q*可能是公司在AGI方面的一个突破，也就是说，一定程度上实现了在最具经济价值任务上，超越了人类。

当被问及Strawberry更多细节时，OpenAI发言人表示：

OpenAI希望AI模型可以像人类一样看待和理解世界。这些系统的推理能力，会随着时间的推移而得到改善。

这一新项目，也被内部赋予了高度的期望。

研究人员们希望，AI不仅仅能够生成针对查询的结果，还可以提前计划，自主可靠地查阅互联网，执行OpenAI所言的「深度研究」的任务。

除了这些挖墓信息，剩下就只剩下人们的猜测了。

自GPT-4面世以来，已经过去了17个月，大约一年半的时间。

虽然今年，OpenAI也发布了新模型GPT-4o，以及GPT-4o mini，它们皆是原生多模态基础模型。

但来自竞家Anthropic、Meta等公司的竞争也愈加激烈。他们发布的模型在某些任务中，能够与GPT-4o抗衡，甚至略胜一筹。

不过，在所有人看来，正值OpenAI高层大换血之际，奥特曼似乎并不担心。

OpenAI动荡不断，AGI何时到来？

考虑到OpenAI正在面临的挑战：下一代AI模型被寄予厚望、潜在的重大财务损失、多起诉讼以及对与微软合作关系的审查。

总裁兼联合创始人Greg Brockman的休假，以及联合创始人John Schulman的离开，就显得十分耐人寻味了。

作为Superalignment团队的前联合负责人，Leike表示，自己离开的原因是希望专注于AI安全和社会影响，而这一点与公司存在分歧。

和Jan Leike类似，John Schulman也跳槽去了竞争对手Anthropic那里，继续专注于AI安全方面的研究。

不过，Schulman公开的原因并非是「OpenAI缺乏对『对齐』研究的支持」，而是出于「个人的决定」。

去年11月Sam Altman「罢免事件」的主角之一，联合创始人Ilya Sutskever，在OpenAI奉献了近十年后也宣布离职。

随后，他与两位合伙人共同创立了Safe Superintelligence Inc.，以解决超级智能 AI 的安全问题。

其他还有：

- Logan Kilpatrick（首位开发者关系责人，现已加入谷歌）

- Peter Deng（前消费者产品副总裁）

- Andrej Karpathy（创办了自己的AI培训初创公司）

……

这些变动让一些人不禁怀疑，如此之多大关键员工在跳槽（或者像Brockman一样长期休假），OpenAI距离传闻已久的突破究竟还有多远？

正如AI开发者Benjamin De Kraker所说：「如果OpenAI即将实现AGI，为什么不断有大佬选择离开？」

所谓通用人工智能（AGI）指的是一种假想的AI系统，能够在广泛的任务中匹敌人类水平的智能，而无需专门训练。

这是OpenAI的终极目标，公司CEO Sam Altman曾表示它可能会在「相对较近的未来」出现。

然而，这个术语的定义非常模糊，整个AI社区对于什么是AGI，以及我们距离实现它还有多远，存在着相当大的争议。

NYU教授Gary Marcus推测，如今的LLM在能力上已经达到了一个以GPT-4级模型为中心的平台期。因为自2023年3月OpenAI的那次突破性发布以来，就没有AI公司实现过重大飞跃。

对此，微软CTO Kevin Scott则反驳称，LLM的「缩放规律」（即模型能力的提升与投入的算力成正比）将继续带来改进，对于下一代模型（比如GPT-5）的训练，仍需更多耐心。

但无论如何，业界都在屏息等待OpenAI或其竞争对手的突破，从而证明训练和部署LLM的巨额成本是合理的。

人才离开的是OpenAI，而不是AI

OpenAI曾在公司董事会风波之际，说过一句话——没有员工，OpenAI什么也不是。

而现在，大批员工叛逃OpenAI，并非转行......

大多数人依旧留在了AI行业，加盟了竞争对手谷歌、Anthropic，有的甚至创办了初创公司。

显然，他们并没有对AGI失去了信心，只是对OpenAI失去了信心。

不过，原因也有可能是，去年内乱之后，OpenAI领导层危机危机仍未解除，而非人们对AI潜力丧失信心。

如果OpenAI正开发改变世界的AI，为什么会在这个时候，一些资深的AI大佬还要选择逃离公司？难道他们不想成为，改变历史时刻的一部分吗？

如果你确信OpenAI将在一两年内破解AGI，手里还有公司股份，为什么还要跳槽？

正如De Kraker如上分析所言，于情于理，只能证明OpenAI真的失去了people。

参考资料：

https://arstechnica.com/information-technology/2024/08/major-shifts-at-openai-spark-skepticism-about-impending-agi-timelines/

https://the-decoder.com/is-openais-brain-drain-a-sign-of-ai-winter-or-just-bad-management/

https://venturebeat.com/ai/sam-altman-stokes-rumors-of-new-openai-foundation-model-strawberry/

https://x.com/sama/status/1821207141635780938

IT界那些事儿

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。