ChatGPT被证实越来越懒!都学会反过来PUA人类了。。。

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【视觉和Transformer】微信交流群

扫码加入CVer学术星球可以最快学习到最新顶会顶刊上的论文idea和CV从入门到精通资料,以及最前沿项目和应用!发论文搞科研,强烈推荐!

fac11e09acb6d943878de82f5e3a52d3.jpeg

转载自:机器之心 |  编辑:陈萍

OpenAI 表示自 11 月 11 日以来,他们就没有更新过模型,模型行为是不可预测的,他们正在研究如何修复。

不知你有没有注意到,最近一段时间,GPT-4 变得有些「懒惰」,现在的它,老是拒绝执行某些任务或直接返回简化的结果。 

这个问题得到很多网友的共鸣,纷纷开始抱怨 ChatGPT 变「懒惰」这个事实。

用户声称,最近使用 GPT-4 或 ChatGPT API 时,在高峰时段响应变得非常缓慢且敷衍。在某些情况下,它会拒绝回答,而在另一些情况下,如果出现一系列问题,对话就会中断。 

据报道,如果用户请求 GPT-4 写一段代码,会出现上述问题。它可能只提供一些信息,然后指导用户填写其余部分。有时, GPT-4 会告诉人们「你可以自己做这件事 」。

GPT-4变「懒惰」一些示例展示

「GPT 确实变得更加抗拒做乏味的工作。本质上是给你部分答案,然后告诉你做剩下的事情。不敢想象,当你运行查询时,你的数据库只读取了前 10 行的信息。」专注于销售和营销的 Summit 创始人 Matthew Wensing 抱怨道。

2d3b65a5e270b57c627e9e4b9633c7e6.png

「让它扩展一些代码,生成的代码要求达到 50 行,它让我自己去做。」

a0f953c2b795b77bdb08f1292cbaa032.png

有时 ChatGPT 受够了网友的请求,最后直接来了个「白眼」,让你自己体会。

733d5b391692def843281c349d3329ee.png

「现在的 ChatGPT 无法帮助用户处理代码脚本。」

c0d8b1c9af2b65d5e9d516943cdee729.png

沃顿商学院 Ethan Mollick 教授将 GPT-4 在 7 月和现在的表现进行了对比,他得出的结论是:GPT-4 仍然是知识渊博的,但也存在懒惰这个问题,GPT-4 非常乐意向用户解释如何修复代码,而不是实际修复代码。

随后, Mollick 教授表示,「同样,我们没有证据表明 GPT-4 以任何方式变得更加愚蠢,这可能是系统负载的暂时问题(例如 openAI 现在将 DALL-E 3 的图片响应从 4 张减少到 1 张),但在以下方面 GPT-4 肯定存在行为变化:系统在没有刺激的情况下愿意做多少事情。」

835aac4c409db11d8129dfe2b9906533.png

不仅 X,Reddit 上也到处是讨论的帖子,最近一则名为《ChatGPT 已经变得非常懒惰》的帖子爆火。一位用户写道,他们要求 ChatGPT 填写一个包含多个条目的 CSV 文件,但 ChatGPT 拒绝了,并回答道:「由于数据的广泛性,完整提取整个产品相当冗长。但是,我可以提供包含此单个条目作为模板的文件,您可以根据需要填写其余数据。」

b586374a8256b2d4ca53bdd401abc49e.png

对于这一回答,发帖人直接发飙了:「这就是人工智能应该有的样子吗?一个专横的懒惰机器人,让我自己去做?」

鉴于 ChatGPT 现在的表现,网友开始纷纷怀念以前的 GPT-4 了。

3e85ad3905bd19996e0b730d45afcfb8.png

OpenAI 承认了,但不确定是什么原因造成的

有些人开始猜测是因为 OpenAI 合并模型、同时运行 GPT-4 和 GPT-4 Turbo 导致服务器持续过载、公司试图通过限制结果来节省资金等造成的。

众所周知,OpenAI 的运营成本极其昂贵,今年 4 月,研究人员表示,每天需要花费 70 万美元,即每次查询花费 36 美分,才能维持 ChatGPT 的运行。根据行业分析师当时的说法,OpenAI 必须将其 GPU 群扩大至 30000 台,才能在今年剩余时间内保持其商业性能。除了为其所有合作伙伴提供计算之外,OpenAI 还需要支持 ChatGPT 其他流程。

对于这个问题,ChatGPT 官方账户发布了推文,OpenAI 承认了这个问题,但不确定是什么原因造成的。「我们已收到您关于 GPT4 变得更加懒惰的所有反馈!自 11 月 11 日以来我们就没有更新过模型,这当然不是故意的。模型行为可能是不可预测的,我们正在研究修复它。」

5738685879ef59dbb5cfb173cb559eb8.png

简而言之,OpenAI 表示他们最近没有对 ChatGPT 或 GPT-4 进行任何会使其变得更加懒惰的更改。事实上,自 11 月 11 日以来,没有任何变化。但他们解释说,模型本身「可能是不可预测的」,他们正在寻求解决的问题。

12 月初,OpenAI 员工 Will Depue 在 X 中也证实了,OpenAI 已注意到有关 ChatGPT 变懒惰的报告,正在研究潜在的修复方案。 

9572837069595fdb2761e48893a4bea8.png

从他的回答中我们可以看出 ChatGPT 确实存在过度拒绝用户问题以及其他奇怪的行为(例如最近的懒惰问题),但这些都是不断服务和尝试支持众多用例过程中的迭代产物。他指出,当 ChatGPT 的某些部分显著改进时,这些改进通常不会被广泛注意到。相反,当模型的某些部分偶尔出现退化时,这些问题就会变得非常明显。尽管存在一些问题,如过度拒绝和偶尔的性能退化,但这些都是改进过程中的一部分。OpenAI 鼓励提供具体反馈以帮助快速解决这些问题。

在等待 GPT-4 性能稳定的同时,用户们互相打趣,「接下来你就会知道它会『请病假』。」

参考链接:

https://twitter.com/ChatGPTapp/status/1732979491071549792

https://arstechnica.com/information-technology/2023/12/is-chatgpt-becoming-lazier-because-its-december-people-run-tests-to-find-out/

https://www.digitaltrends.com/computing/heres-why-people-are-saying-gpt-4-is-getting-lazy/

CVPR / ICCV 2023论文和代码下载

 
 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集
计算机视觉和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-计算机视觉或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

 
 
▲扫码或加微信号: CVer444,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!

▲扫码加入星球学习
 
 
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看218b6b76c099e4606a223b76855de5e5.gif
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值