神秘模型"gpt2-chatbot"现身,引发GPT-4.5/GPT-5疯狂猜想

123637570e9fbe9ec4bb4200bf5a5141.jpeg

来源:大数据文摘受权转载自头部科技

文:Congerry

OpenAI 放出了一个迷雾弹。

当Google、Meta、Anthropic等公司都在猛推大模型的时候,OpenAI除了对GPT-4修修补补,似乎一直没有什么大的动静。

但是今天,一个名为"gpt2-chatbot"的神秘大模型凭空杀出,其能力似乎与 GPT-4 保持在同一水准,甚至在一些任务上的表现比 GPT-4 Turbo 还要好,让整个AI社区炸开了锅。

11e7f56f75890ed491d52a1b04a7d43d.jpeg

这不禁让人联想一直未曾露面的GPT-4.5或GPT-5。就连Sam Altman也发了一段让人摸不着头脑的话,自己对 gpt2 情有独钟。

00a26207adab3010e0cca703ae261b2d.png

3a72088c2db49f242649bdfdaabb18cb.jpeg

神秘模型"gpt2-chatbot"现身

这个"gpt2-chatbot"表现如何呢?

该模型第一次尝试就解决了国际数学奥林匹克竞赛(一项面向高中生的著名竞赛)中的一个问题。

75e7fb60ce11e898c3d2aca1125c28b4.jpeg

人工智能研究员、斯坦福大学学生Andrew Gao说,要知道国际数学奥林匹克竞赛难得要命,只有美国数学成绩最好的四名学生才能参加比赛。

宾夕法尼亚大学沃顿商学院研究 AI 的教授 Ethan Mollick 表示,在他的实验中,该模型在复杂的推理任务(例如编写代码绘制独角兽图片)上表现优于 GPT-4。“也许比 GPT-4 更好,”他说。“很难说,但它在标志性的‘用代码画独角兽’任务上确实做得更好。”

4b66801559be528a8ae1298b1dae569d.jpeg6c38181edda66976683a00f7b42b0a47.jpeg

该模型还表现出了编写具有挑战性的代码的能力。

CodeGen 的创始工程师 Chase McCoy 表示,gpt2-chatbot “在我们用来测试新模型的所有编码提示上都做得更好”,而不是 GPT-4 或 Claude Opus。“这种氛围肯定是存在的,”他说。

但也有不少人持谨慎怀疑态度,认为gpt2-chatbot的能力被过度夸大了。他们指出:

这个模型在经典的24点游戏、数学推导等老题types仍然采取的是暴力式枚举推理,而未展现出任何更先进的解题手段。

在绘画时,也不遵从指令。

f51e3e725d5b9bfa42cb8e31aea8adc6.jpeg

fdfb40ae5742e29824390f88c90ec253.jpeg

在经典的"农夫过河"推理题上,gpt2-chatbot的5步解法也显得冗长。

2ff395f2666cb24f5712be62cf00607c.jpeg

引发GPT-4.5/GPT-5疯狂猜想

那么,这个gpt2-chatbot到底是什么来头?

通过对它的一些细节分析,网友们给出了以下几种可能:

它就是OpenAI后继GPT-4的下一代大模型GPT-4.5,或者是传闻已久的GPT-5。

但是Andrew Gao认为,如果这就是GPT-4.5或者GPT-5的能力,那么意味着人类在AI上面碰壁了。言外之意,gpt2-chatbot“不配”。

254d659ee98e4f64abeed30dd4fa6076.jpeg

也有网友认为它是在GPT-4的基础上,融合了开创性的"Q*"推理技术,而非全新架构。这可以解释它为什么在某些特定任务上能给出远超GPT-4的惊人表现。

还有网友认为它是由OpenAI 2019年发布的GPT-2模型经过了LMSYS等机构的特殊调教和改造所获得,其实质还是老架构。

另外,还有人猜想它其实就是由LMSYS这家从事AI技术研究的公司打造出来的全新模型,只是在整个AI界伪装成"来自OpenAI"罢了。

对于这个谜一样的问题,Sam Altman也是卖了个关子,在推特上表示"我确实很钟情gpt2。

ChatGPT"人性化" 率先推出记忆功能

除了gpt2-chatbot,OpenAI本身也在悄悄推出一些重磅新功能。

最新的消息是,OpenAI正在为ChatGPT Plus用户推出一项全新的"记忆"功能。简单来说,用户在与ChatGPT对话时,可以让它记住特定的信息细节,这些记忆会一直保留下去,并会在下一次对话时被调用和使用。

比如,如果你告诉ChatGPT你家里的小孩特别喜欢水母,那么下次让它帮忙设计生日贺卡时,它就会为你推荐使用水母图案。OpenAI称,未来ChatGPT甚至可能比你的家人更了解你了。

这个"人性化"的记忆功能,被认为是朝着AGI(人工通用智能)迈出的一小步。它让ChatGPT更贴近真实世界,个性化程度更高,对话体验也更加自然。多数网友对此新功能表示欢迎,不过也有人担心隐私问题。

OpenAI还透露,未来这个功能还会面向企业用户推出,并扩展到GPT语言模型的其他版本。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

68e08f5b93aaae897dd92704a9b8b6ec.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值