如果用大模型考公,kimi、通义千问谁能考高分?

都说大模型要超越人类了,今天就试试让kimi和通义千问做公务员考试题目,谁能考高分?

测评结果再次让人震惊!

问题提干:大小两种规格的盒装鸡蛋,大盒装23个,小盒装16个,采购员小王买了500个鸡蛋,大盒装一共比小盒装(),请问括号中填多少?

备注: 这里稍微改写了下原题描述,避免大模型搜索网上的答案。

Kimi考公

kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。


通过上面的对话可以看出kimi开始给的方程式 23x + 16y=500对的,但是自己无法计算出结果。

后面经过几轮对话,我失去了耐心。。。。

放弃吧~

结论:kimi考公失败

通义千问考公

通义千问开始方程式和kimi一样:23x + 16y=500,但是他一开始认为无解,经过我二次提示,他给出了答案:x=16, y=7,且洋洋得意地计算464+112=500,这也是一个加法错误。

我尝试告诉他有其他答案,这个答案不对。

但是他却倔强地说这是唯一解。

算了算了。

你是唯一解,你没通过考验!

结论:通义千问考公失败

总结

通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。

即使使用最笨的方法,从x=1~x=21遍历也能得到答案。

kimi有尝试使用遍历方法,但是不知道为啥直接从x=1跳到了x=14,就跳过了x=12, y=14的题目答案,与答案失之交臂。

通义千问给出了错误答案,坚持到底。

如果您对测评结果有疑问,欢迎交流,更多大模型案例在公众号首发。

#AIGC #kimi #通义千问 #大模型

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值