GPT4o 大战高考数学, 惨败

以 2024 高考数学 新课标1卷为例,我们来测测 GPT4o 的多模态推理能力。

一、概率图推理

这个题非常考验学生利用图形来推理出概率的大概范围,注重对思维逻辑的考察,而不是计算过程。GPT4o 无法自己画图来进行推理,因此也只能猜一个答案,如下图所示。

我们发现他在查表,然而并没有表供他可查,产生了幻觉。

无法作图,欠缺复杂图形推理能力仍是GPT4o的缺陷。

正确答案如下:

二、函数图推理

再来看一道函数图推理,如下图。

GPT4o仍然是无法作图来进行推理分析的。

我们看他的解题过程。

不难看出,GPT4o前三个步骤的分析都是没有问题的,但是第四步验证选项都是通过带入一些选项来进行分析,不仅慢,正确率也不能保证,我们看下根据图分析的正确求解过程。

画完函数图像后,可以直接过渡到第四步,既快又准哈。

三、曲线方程

这个回答仍是有问题的,第五步的分析是通过代入x=0去求解,虽然答案是对的,但过程是错的,正确解题过程如下图所示绿字的推理,我们从导数的角度分析,斜率不等于0,未取到极值点,因此纵坐标的最大值不是1。

第六步的分析也存在问题,把 y0 单独提出来是正确的,但后面出现了幻觉,产生了无法推出结论的过程。

正确的分析过程位于下图右下角。

总结

从这几个案例可以看出,我们的高考的重心从 计算 移向了 图形综合推理,对思维能力的要求非常高,弱化了计算,而这恰好是大模型的弱点,短期内无法补齐。

因此教育行业要重点发力在对学生的思维能力的培养,提升他们思维能力、探究和解决问题能力。

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

热爱技术的小胡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值