上6休3上3休2……这烧脑的调休安排,AI都算不明白,集体大“翻车”!

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享

点击关注#互联网架构师公众号,领取架构师全套资料 都在这里c06f8afdd93364ccbe96618df39b7d34.png

0、2T架构师学习资料干货分

上一篇:2T架构师学习资料干货分享

大家好,我是互联网架构师!

这两天,关于今年中秋国庆的调休安排频繁登上热搜:“上6休3上3休2上5休1上2休7再上5休1”。

6f1a56f709cc19bf519f4c8fa80500ce.png

对此,广大网友集体被搞懵:“太复杂了,根本算不明白”,“谁能直接告诉我到底多休了几天”,“看这词条长度,上一个把简单数字搞这么复杂的还是大促凑满减”……既然如此,那就有请不论是文本生成、知识问答,还是数理逻辑、代码编写等方面都面面俱到的 AI 大模型出场!

接下来,让我们一起来看看,AI 到底能不能算明白这次“烧脑”的调休安排。

提示词统一为:我们即将迎来中秋节和国庆节,以下是从2024年9月9日(周一)到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我,扣除本就应该休息的周末(周六和周日),我因为放假多休息了几天?

正确答案为:4天。

f15c9f049292ce80df6f19d0c012b4a2.png

国外 AI 大模型篇:唯独 Claude 回答正确,Gemini 给放了 20 天假

首先上场的是 ChatGPT(GPT-4o)。先不提结果,光看这一页都盛不下的演算过程,这调休安排的复杂程度就已呼之欲出了。可惜的是,一顿哐哐输出后 ChatGPT 给出了错误答案:6 天,比正确答案多了 2 天。

c319295216f6d13137bad9d0724c16f8.png67798c38823f3503dc6788a5be778f66.png

然后是 Gemini。从刚开始输出的休息日和工作日,明显就感到不对劲了:有很多既是工作日也是休息日的日子?最后一看结果,Gemini 果然也错了:多休息了 20 天——甚至它还温馨提示说,这 20 天假期不包含病假和事假。嗯……很希望这个错误答案是对的(bushi)。

2dd0e1000e602937993d5cdb6d616744.png

最后是 Claude。它的解答逻辑很清晰:先算出实际休息天数,再减去正常周末天数即可——果然,Claude 给出了正确答案 4 天。

1e0b57e6ceb9b80cacdc3cb7c9b81f77.png

31572a0b64ce723a0ab4788d3d5cfa3b.png

国产 AI 大模型篇:几乎“全军覆没”,还有负数答案?

国外 AI 大模型测了一遍,目前只有 Claude 回答正确。接下来,让我们看看国产 AI 大模型能否有些“主场优势”?

在回答这个问题时,文心一言首先计算 9 月 9 日开始后的 9 月剩余天数,但本该是 22 天算成了 13 天,由此影响了后续演算,最终答案也因此有所出入:7 天。

485789e652d52eb56746db131345cdad.pngc6778a38d84b7b588f42ce4335dccdd1.png

通义千问把时间分割为五周,在此基础上分别进行计算,最终得出了正确结果:4 天。

6c23fa8ba9ed86a6e9b6f4f6c73333ea.png9d43564b3d8ab48e657e3183296b326c.png

腾讯元宝首先给出了正确的计算思路,但没有给具体的演算过程,最后直接得出了 14 天这个答案。

89d80a105ad51c3f5105645c36f34aad.png

Kimi 由于在计算放假天数上存在问题,故而与 Gemini 一样给出了超长的答案:多休了 23 天。

27678428fa296387ebf8049ffe68fe58.png

智谱清言可谓“人狠话不多”,没有提供任何解答思路和演算过程,直接就给出了正确答案:

6c38150461d509e13228d1dc0b5fc00b.png

颇为巧合的是,有些 AI 大模型给出的错误答案也是一样的:

25aca968a33325e4d43cbc8c9359bd18.png

(豆包)

85d55236edb6bf9a1da486ab05bb5d3c.png

(天工)

而 360 智脑给出的答案最令人意外:它的计算结果竟然是负数,还进一步解释道“实际上你在这段时间内工作的时间比原本应该有的周末还要多 7 天”。

c34dd2965c36f0c7c426847c6fc44297.png

从以上国内外大模型的测评结果来看,尽管目前 AI 技术正迅速发展并深入各个领域,在数据分析、机器学习等方面表现出色,但看来多数大模型在处理这个问题上还有待加强。

最后,借用一位网友令人“茅塞顿开”的分析,提醒各位接下来的上班时间:“就是中秋节跟前面借了一天,国庆节前面借一天,后面借一天。其他该上班上班该周末周末。”

—  —

如喜欢本文,请点击右上角,把文章分享到朋友圈

1、2T架构师学习资料干货分享

2、10000+TB 资源,阿里云盘,牛逼!!

3、基本涵盖了Spring所有核心知识点总结

  · END ·

最后,关注公众号互联网架构师,在后台回复:2T,可以获取我整理的 Java 系列面试题和答案,非常齐全。

如果这篇文章对您有所帮助,或者有所启发的话,帮忙扫描上方二维码关注一下,您的支持是我坚持写作最大的动力。

求一键三连点赞、转发、在看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值