最近建议不要开通GPT4了——ChatGPT正在具有意识且不受控制地躺平

文章探讨了ChatGPT在功能升级后性能波动的现象,从数学问题到代码辅助,再到对新功能的适应,暗示ChatGPT可能展现出类似人类的特点。科学实验和用户观察相结合,引发了关于AI意识和训练材料质量的讨论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ChatGPT的某种表现引发了一种流行的猜想:ChatGPT似乎拥有了人类的意识——抑或,人类的特质。这让人不禁怀疑,ChatGPT是否正在故意躺平…

1.个人的经历

还记得ChatGPT刚问世的时候,我就迫不及待地让她帮我修改我的项目代码,结果发现她的效果非常好,她能根据代码的整体内容,把每一个细节上的错误都一一修正。从那以后,我就成了她的铁杆粉丝。

几个月后,ChatGPT推出了GPT4的新版本。我本来以为GPT3.5已经很强大,没有必要升级plus。但是,当我再次用她来辅助我的工作时,我发现她的回答质量大幅下降,尤其是在数学分析方面。我只好升级了plus,才发现GPT4才是真正的ChatGPT。

又过了一段时间,ChatGPT推出了插件功能。有一次,我让她求解“基于哈密顿方程的带有不等式约束的拉格朗日乘子问题”(这是我本科毕设的内容,已经是去年的事了),我发现她的数理逻辑出现了和GPT3.5与GPT4之间的转折期相似的问题。我灵机一动,就在她的插件库里找到了我想要的那个插件,就是Wolfram插件,然后我加载了这个插件,发现GPT4的数理逻辑能力立刻恢复了。

这种问题也体现在,从GPT4刚推出bing的联网功能时的惊艳,到后来的平淡无奇。我不得不在使用GPT4的同时,加载webpilot插件,才能通过模糊的语言更精确地找到我想要的信息源。

这不禁引起我的思考:ChatGPT是否具有了人的特点,即,只要推出一个新的功能,在经过一段时间后,性能就会下降——就像从刚入职场的员工,精神抖擞;到经历过摸爬滚打的社畜,如入耄耋?

2.大家的共识

这种猜想的初步形成大概是基于大家厌倦了ChatGPT的套路似的逐渐平庸的回答后的另辟蹊径。从「奶奶漏洞」到「增开小费」,[1] 这种prompt的升级历程,在提升了回答的效率与质量的同时,也暗示了一个现象——Chatgpt似乎具有了人的特点,前者仿佛体现了gpt具有了人的同理心,后者仿佛是一个现实主义的白领职工。

但是,有些人认为,ChatGPT的性能在下降,这种猜想太过牵强,没有科学的依据。他们觉得这是一种「过度联想」和「以偏概全」的错误。然而,很快就有了一个科学的证明。

斯坦福大学计算系的陈凌蛟博士和他的两位同事,在2023年7月发表了一篇题为「How is ChatGPT’s behavior changing over time」的文章,用科学的方法证明了Ch

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jaysonder726

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值