2024福建中考数学代数证明题可以减弱已知条件,并评AI的证明

1 篇文章 0 订阅
1 篇文章 0 订阅

早上一老同学微信发我今年福建的中考数学题。上午没时间,女儿中午要吃汉堡烤鸡,店里借了笔,在餐巾纸中写了下。其实没什么难度,而且第二小题,还可以进一步缩小已知条件。发到朋友圈后,有同事建议我发给ChatGPT做,测试看看。

已知,实数 a, b, c, m, n 均满足 3 m + n = b a , m n = c a , 3m+n=\frac{b}{a}, mn=\frac{c}{a}, 3m+n=ab,mn=ac,

(1)求证: b 2 − 12 a c ≥ 0 b^2 - 12ac \ge 0 b212ac0

(2)若a,b,c均为奇数,m,n是否有可能都是整数,请说明理由。

我的证明:
在这里插入图片描述

我本来是想这么简单的题,ChatGPT 应该没有问题,因此第1个就发给了ChatGPT-4o,但是ChatGPT-4o 的回答惨不忍睹。我猜测ChatGPT-4o由于是个多模态模型(支持语言、语音、图像、视频)导致了它在数学方面的减弱。于是我发给阿里的的通义千问2.5模型看看,通义千问第一小题正确,第二小题错误。最后我发给百度的文心大模型3.5,文心3.5第一小题正确,第二小题可以得一半的分,因为它没有说清楚为什么 ( 3 m − n ) 2 (3m-n)^2 (3mn)2 是偶数,应该先推出 m 和 n 都是奇数,才可以得出这个结论。

注意到文心第二小题的证明利用了第一小题计算结论, b 2 − 12 a c = a 2 ( 3 m − n ) 2 b^2-12ac=a^2(3m-n)^2 b212ac=a2(3mn)2,其实用这个结论显然增加了复杂度,我的证明就没有使用,直接用已知条件就足够了。

大模型的回答请参考下面的截图。

从这里我们也可以对当前大模型的能力有个基本认识:数学其实也是一门语言,有自己独特的符号,强调逻辑、推理以及计算,但数学又不像编程语言一样那么严密–因为数学的表达基本还是靠自然语言和数学符号组织构成的。因此大模型可以解决一些数学问题,毕竟它已经学过海量的数学题(题海战术),它可以像人类做梦那样不加思索地照搬学过的解题套路解决问题。如果这个套路刚好正中下怀,那么就可以轻松解决(如第一小题);如果这个套路错了,那么模型无法意识到已经错了要尝试换个套路尝试,它会非常有勇气并信心满满地继续自圆其说。简单的说当前的大模型缺乏自省能力!如果大模型加上了自省能力,那将非常可怕,达到人类甚至超过人类的智能将不在话下。

用孔子说的话评大模型最好不过了:知之为知之,不知为不知,是知也。

话说回来,即使当前的大语言模型有幻觉(缺乏自省能力)对数学教育、数学研究也是非常有益的,毕竟它可以给我们一些思路或灵感。在编程领域就更不用说了。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

原文链接
2024福建中考数学代数证明题可以减弱已知条件,并评AI的证明

欢迎关注我的微信公众号[数学345]:长按"识别图中二维码";或打开微信扫一扫。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值