看看通义天问AI的水平怎么样?

写在前面

我问了通义千问一个问题:gooey项目改名后的新名字是什么?
这个问题很模糊,它把gooey理解为一个python库,这很正常,毕竟该项目知名度大。
随着对话的进展,我补充了相关信息,将上下文领域限定在Rust GUI,它理解了我说的gooey是特指另一个项目(后有所反复,又误以为是那个Python库,我立刻给予了纠正)。
一开始它不知道gooey改名,更不知道改名后的新名字。
这是一个常识题,如果它被训练过相关内容,就会知道答案,否则不知道答案,都很正常。
毕竟这条信息还是很新的,产生于对话当日前约三天。
于是我告诉它答案,gooey改名为cushy了。但是它不认可我的答案,要求我出示证据。
这个有点意思,它貌似具备求证意识。
我给了它链接1,它不认可。正常,里面的确没有gooey改名的信息。
我给了它链接2,它立刻认可了,确认gooey的新名字是cushy。
这里居然给了我一个“惊喜”。这表现就好像它真的看懂了链接2里面的文字。
我立刻向它求证,被它否认了。它说它没有访问链接的能力,更不可能去阅读理解里面的文字。
那我就有疑问了,既然你没有阅读链接2,怎么做到确认gooey改名的信息呢?
我给出链接2之前࿰

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值