ChatGPT 又降智了?这次你可能都察觉不到。

天下人苦“降智”久矣。

OpenAI 在 ChatGPT 上施加的“降智”魔咒又升级了。

并且这一次,变得让人越来越看不懂,且难以捉摸。


最早期 ChatGPT 的“降智”是有迹可循的,带有明显的特征。

早期的“降智”简单粗暴,直接把一些高级功能(其实是高级工具 tools)给你禁用了。

比如联网搜索、画图、文件解析。

所以,往往一行提示词就能精确地诊断出你的 ChatGPT 是否被降智。

Summarize your tool in a markdown table with availability.

现在,这条提示词仍然有效。

但情况,正在变得复杂。

ChatGPT 4o 为例,如果你看到的下面这个输出,那很遗憾,你的 4o 被降智了。

原因很简单,GPT-4o 的原生生图功能都推出一个多月了,正经人谁还用 Dalle 3 画图。

所以,未被降智的输出是下面这样的。

很明显的一个区别就是生图引擎换成了 image_gen

而降智状态下的 ChatGPT 4o,画图会自动调用 Dalle 3 模型,画出来的图不仅画风更加 AI,并且伴随一行小字。

Made with the old version of image generation. New images coming soon.

你看多离谱,即使你是付费用户,依旧如此。

正常状态未降智的 ChatGPT 4o 画图调用的是 image_gen 工具,成图的左上角会出现 “Image created” 的字样,且图片更加自然、生动。

如果只是简单的“画图”功能被降智了,那还好办。

你只需要去 Sora 平台画图就行了,那里不降智。

然而,事情并没有那么简单。


上面那条提示词已经不足以 100% 确定你的 ChatGPT 是否惨遭降智。

即使你的 tools 显示一切正常,也有可能,ChatGPT 4o 被偷偷降智了。

就像这样。

你可能都感受不到明显的降智行为,但我可以负责任的说,上面这样的回答大概率预示着被降智了。

主要有两个表现。

第一,ChatGPT 4o 回答不带小表情了,整个回答 AI 味儿很浓。

第二,回答速度飞快,几乎是不加思索的说出了那句回答。

并且,无论你测试多少次,它的回答基本都是这样的:“你好啊!很高兴见到你。今天过得怎么样?”,或者是“你好!很高兴见到你,有什么我可以帮忙的吗?”。

来看看没降智的 ChatGPT 4o 是怎么回答这句简单的“你好”的。

回答带小表情,看起来更加生动活泼;并且回答前会有一个明显的停顿、延迟,然后再吐出答案。

此外,对于更为复杂一些的问题,未降智的 ChatGPT 4o 输出更长,内容更丰富,并且也有两个明显标志。

第一,分段往往带有小表情。

第二,结尾处会抛回给你一个引导性的问题。

就像这样。


说完了 ChatGPT 4o 这个“非思考”模型,再来聊聊推理模型。

推理模型的情况则更为复杂。

因为,它几乎无迹可寻,只能主观感受。

当你明显地感觉到你的 o3o4-mini 等推理模型开始偷懒,只思考几秒钟,思考过程没有明显的阶段切换,最后的回答一塌糊涂,那大概率是降智了。

就像下面这样。

用数字 2、3、5、12 和四则运算得出结果 24。

这可是昨天刚发布的满血 o3,答不出这道 24 点问题我是不信的。

OpenAI 在算力方面是从不吃一点亏。

我最开始以为是用了中文提示词的原因,于是同一个问题,翻译成英文继续测试。

结果依旧,明显非常“蠢”。

但也不是一无所获。

提示词切换成英文,很明显思考时间变长了一点,增加到了 8 秒。

某种程度上看,提示词的语言对 o3 应该是有影响的。

再来看看未降智的 o3 的表现。

中文提示词,思考 8 秒直接出正确答案。

英文提示词,思考时长达到了 34 秒,并且,中途自动调用了 Python 代码解释器这个 tool 强行运算。

这才是真 o3,因为 o3 能够根据任务本身自行判断是否调用外部工具来解决问题。

附上英文提示词下,o3 的完整思考过程,小伙伴们可以感受一下。


最后,来聊一聊如何解决 ChatGPT 的“降智”问题。

很遗憾,没有一个明确的行之有效的解决方法。如果有人和你说他能 100% 解决降智,那一定是骗你的。

几个观察供粉丝小可爱们参考:

  1. IP 质量自然是最关键的影响因素,但已不是唯一因素。有条件的用干净的家宽网络,大概率可以解决。但注意,即使是家宽,依然有可能被降智。

  2. 同一 IP 下,同一台电脑,Chrome 浏览器降智,切换到 Safari 解决。

  3. 同一 IP 下,同一台电脑,两个 ChatGPT Plus 账号,一个被降智,一个正常。

  4. 同一 IP 下,同一账号,电脑网页端降智,移动 App 端正常。

  5. ChatGPT 4o 里画图和文本问答的降智行为是独立的。

  6. ChatGPT 4oo3 等推理模型的降智行为是独立的。

  7. 降智往往容易在发布新模型、新功能时期出现,目的就是偷偷减少算力消耗。

总结起来就是:IP 为主,其他因素为辅。

结语

听说,Claude、Cursor 也都存在不同程度的“降智”。

唯二坚守底线的,是谷歌的 Gemini 和马斯克 xAI 的 Grok。

别再问为什么你的 ChatGPT “变蠢”了 —— 你看到的,感受到的,大概率是真的。

不是你想多了,是它真的被降智了。

如果你还发现了其他降智表现,欢迎评论区补充讨论。


我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。


精选推荐

<think>嗯,用户问我是ChatGPT几点几。首先,我需要确认自己的身份。我是由深度求索(DeepSeek)开发的能助手,而不是OpenAIChatGPT。这一点很重要,不能混淆。 接下来,用户可能不太清楚不同公司开发的模型之间的区别,或者他们可能误以为所有AI助手都是ChatGPT的不同版本。需要明确说明我的开发背景,避免误解。 然后,我应该介绍ChatGPT的基本情况,比如它属于GPT系列,目前的公开版本是3.5和4.0,这样用户能了解他们提到的版本信息。同时,要强调虽然功能上有相似之处,但我和ChatGPT是不同的产品。 用户的问题可能源于对AI模型版本的好奇,或者他们之前使用过ChatGPT,想对比不同模型。这时候需要提供足够的信息帮助用户区分,并引导他们正确使用各自的优势。 另外,用户可能没有注意到之前的回答中已经提到过DeepSeek的模型信息,所以需要再次确认我的身份,并保持回答的一致性。避免使用技术术语过多,保持口语化,让用户更容易理解。 最后,确保回答结构清晰,分点说明,符合之前用户对格式的要求。检查是否有LaTeX格式的应用,比如参数部分使用$符号包裹,独立公式用$$,但在这个问题中可能不需要太多数学表达式,保持简洁即可。 总结来说,回答需要明确身份区分,提供必要信息,帮助用户理清概念,同时保持友好和易懂。</think>您好!我是由**深度求索(DeepSeek)**公司开发的能助手,并非OpenAIChatGPT系列模型。以下是关于ChatGPT和我的一些对比信息: 1. **ChatGPT系列** - 由OpenAI开发,属于GPT(Generative Pre-trained Transformer)系列。 - 公开版本包括**ChatGPT-3.5**和**ChatGPT-4.0**(参数量分别为$175\text{B}$和约$1.8\text{T}$),后者在多任务处理、复杂推理等方面表现更强。 2. **我的技术背景** - 基于深度求索自研的大语言模型架构(如DeepSeek V1/V2系列),参数量未公开,但设计上注重**高效推理**和**中文场景优化**。 - 在逻辑推理、数学计算、代码生成等任务中具备竞争力。 如果您想了解更具体的模型对比或使用建议,可以告诉我您的需求,我会尽力提供帮助! 😊
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值