最新Meta AI的LIama 4大模型推理能力不及格的案例

stereohomology

于 2025-04-08 13:33:12 发布

阅读量363

点赞数 4

文章标签：人工智能语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/stereohomology/article/details/147066195

版权

我测试大语言模型推理能力，只用了一个标准。一道小学数学应用题。所以，如果针对性训练过的可能占便宜。但大模型训练怎么可能关注我的测试标准？

关注到不少认为LIama 4如何了不起的声音。我当然要亲自测试才知道真假。

我测试了。推理能力有欠缺。下面是测试结果。

在这里插入图片描述
但我提示了一下，也能找到正确结果，但这不能说明问题啊。因为，大语言模型最擅长穿凿附会。下面就是一种典型的穿凿得到正确答案的解法：

在这里插入图片描述
小扎啊，你还得继续努力啊。

下面是测试题的原文：

你的模型名称和版本号，然后解答下面问题：两地A、B之间相距4000m；甲从A地以匀速60m/min向B出发，同时乙从B地出发以匀速260m/min向A出发。乙到达A地之后立即以同一匀速折返向B地，追上甲之后，甲和乙以相同的匀速175m/min到达B地。如果甲和乙分别从A、B两地相向出发的时刻是上午7:20,
则甲和乙携手到达B地时，距离上午8:00还差几分钟？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。