从一个简单计算问题，看豆包、元宝的推理逻辑能力

置顶 tomelrg

已于 2024-11-01 16:56:30 修改

阅读量651

点赞数 12

文章标签：语言模型人工智能

于 2024-11-01 16:39:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tomelrg/article/details/143434771

版权

引言

笔者在另一篇文章（从一个简单的计算问题，看国内几个大语言模型推理逻辑能力）中比较了百度文心一言、月之暗面、深度求索、通义千问、讯飞星火、chatgpt对同一个简单的计算问题的回答结果，比较了他们的现有逻辑推理能力。国内还有的两个大公司的大模型还没有测试，说实话，笔者也是第一次用这两模型，就补了这篇文章。

同样的问题

123456*987654等于多少，给出你计算的过程。

看结果

抖音豆包

好家伙，上去就来乘法分配律，奈何结果错误，这基本的计算看来模型都不理解。这个模型与百度文心一言4.0一样，上来就是乘法分配律。

腾讯元宝

说实话，有惊到我，这解答果然不走寻常路，但逻辑思想也基本上是基于乘法分配律，逻辑推理还是欠缺些，中间的计算过程不正确，结果也不正确。第二次的回答，结果正确，中间过程诸君自行分析吧。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。