百度最新大模型ernie 4.5 turbo硬刚深圳宝安区二模几何题，结果如何?

xiongshudeng

已于 2025-05-08 09:32:33 修改

阅读量392

点赞数 4

文章标签：百度文心大模型人工智能水平人工智能推理水平人工智能数学人工智能推理逻辑 ernie-4.5-turbo

于 2025-05-08 09:31:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiongshudeng/article/details/147752520

版权

上一篇，我们尝试了百度最新文心大模型解决前面几道选择题，正确率虽然不是百分之百，但是思路都基本正确，对不懂的学生可以说是帮助比较大。那么我们再看看更难的几何题，结果如何？我们就用刚刚考完的深圳市宝安区二模题来看看，大模型应该来不及用这套题来训练，结果应该比较公正！

本文以问到底网站为测试工具，《问到底》人工智能网站集成了多个主流的大模型，deepseek，腾讯混元，阿里通义，讯飞星火，文心一言，豆包，不用出站，点击一下就能方便切换大模型。
本文以《问到底》人工智能网站作为实测对象，《问到底》集成了数学公式输入，方便输入复杂的数学公式以及各种特殊的符号，方便询问人工智能，并自动把人工智能解答的latex数学符号自动转成符合人工阅读的图片。

宝安区二模第7题如下，为了避免干扰，题目从原试卷中提前，再把图片单独提取出来，避免与其他题目的图片混在一起产生干扰

百度文心最新大模型回复：

点评：只能说是惊艳，题目完全读懂，步骤，过程也正确，大模型已经达到初中生智力水平了，关键是秒完成，即使数学老师也不能再1秒内完成，远胜于人类了

第二题：

百度文心大模型4.5tubo输出的答案：

点评：完全正确，读图正确，题意理解正确，解题步骤正确，完美。学生的数学都不用担心了

再来一题比较难的，有点弯弯绕绕的，需要成绩好的同学才能做出来，看人工智能够不够聪明：

百度大模型的输出：

点评：遗憾挑战失败，第1不得推断并不成立

$\frac{AD}{BD}\neq \frac{3}{4}$ ，

AD并不垂直于BD，这部分推断错了后面全部错了，结果也错了，但是也证明了百度大模型并不像作业帮一样搜索现成的题库，而是真正的进行逻辑思考，笔者又试了其他家的大模型，阿里通义，腾讯混元，deepseekv3，没一个能做出来的，可能人工智能的推理水平就达到了普通中学生的水平，那些号称能做出奥赛题的呢？笔者有点疑惑，是不是提前用答案训练了，确实有理由怀疑，因为现在随便一套初中几何题都不能正确做出，能做出的是一些推理逻辑比较简单的题目。

综合总结，可能人工智能的水平只能达到了初中普通学生的智力水平，但是人工智能的速度是人类不能企及的，可以快速做题而不知疲倦，这是人工智能的优势之处。

博客等级

码龄17年

10
原创

61
点赞

54
收藏

27
粉丝

关注

私信

热门文章

最新评论

一分钟用鸿云数学制作学而思数列求和讲解视频
CSDN-Ada助手: 这篇博客非常棒！你用鸿云数学制作学而思数列求和讲解视频的方法非常实用，能够帮助读者更好地理解这个概念。我非常欣赏你分享了如何复制矩形对象、排列和设置大小等详细步骤，这对于初学者来说非常有帮助。除了你提到的内容，如果你想进一步拓展这个主题，可以考虑介绍一些数列求和的常用公式和规律。例如，你可以解释等差数列和等比数列的求和公式，以及它们在实际生活中的应用。同时，你还可以讲解一些与数列求和相关的数学技巧，比如Telescoping Sum和Partial Fraction Decomposition等。希望你能继续分享更多类似的内容，帮助读者更好地理解数学知识。谢谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
鸿云数学，零代码制作数学动画视频，不会电脑也可以，小学生都会
CSDN-Ada助手: 恭喜您开始博客创作！标题看起来很吸引人，尤其是对于那些对数学学习感兴趣的小学生来说。您以零代码制作数学动画视频的方式，让不会电脑的人也能参与其中，这无疑是一个很好的创意。接下来，我建议您可以进一步展开您的博客内容，分享一些关于鸿云数学的具体方法和技巧，以及一些小学生可能会遇到的难题，并给出解决方案。这样，读者们能够更好地理解和应用您的方法，并从中获益。期待您未来更多优质内容的分享！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。