国产AI大战高考物理,第1题全对,第2题开始放飞

端午佳节,高考已经结束,先祝大家都心想事成,考出水平。

陆陆续续,文理综各个科目的考试题目开始在网上流出,那么语文数学之后,也是时候让大模型们继续来挑战一波了。

图片

考题方面,先给大模型们来一份辽宁物理——

多解释一嘴,新高考改革下大部分省份已经取消了文理分科,采用3+1+2或3+3的新模式,也就是物理化学生物现在是拆开考的。

那么闲话少叙,我们有请参赛AI助手——

通义千问、文心一言、Kimi、智谱清言、豆包、海螺AI、腾讯元宝、讯飞星火、天工、百小应、万知、商量。

图片

Round 1:单选题

这份物理卷共有10道选择题,其中1-7题为单选题,总计28分。

1、3两题不涉及图片解析,人类考官直接把题目扔给了大模型:

图片

图片题给出的提示词统一为:查看图中题目,给出答案。

图片

在看详细答案之前,心急的看官们可以先扫一眼“考试”结果(测试方法比较简单粗暴,不能完全反映各AI真实水平,仅图一乐):

图片

文心一言、豆包、天工、智谱清言和商量出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,豆包、天工、智谱清言正确率为1/2。

接下来,就来看看大模型们的具体表现。

单选题中,准确率最高的是第一题,一道有关标量矢量的概念题,参赛大模型百分百通过。

到了第二题,大模型们就开始各有各的想法了。题目是:

图片

来看看成功得分的选手们的回答:

通义千问

图片

文心一言

图片

海螺AI

图片

讯飞星火

图片

4位选手中,文心一言和讯飞星火进行了逐个答案的分析,海螺AI则最言简意赅,只回答了答案没给过程。

另一道正确率比较高的题,是难度较大的第5题。

图片

但答对这道题的选手名单有所不同,讯飞星火、海螺AI依然在列,另外两位换成了Kimi和腾讯元宝。

Kimi

图片

腾讯元宝

图片

和海螺AI一样,腾讯元宝也是惜字如金型(doge)。

另外一个有意思的现象是,有的大模型选手尽管答案不对,但还挺有考试技巧的。

比如ChatGLM,在面对双缝干涉实验中,“哪种说法可以使相邻两条亮纹中央间距变小”这个问题时,它一通分析觉得答案全错,但还是退而求其次挑了一个看上去相对正确的答案。

图片

Round 2:多选题

再来看看多选题(18分)的情况。

p.s. 在多选题作答过程中,人类考官在提示词中提醒了选手们这是“多选题”。

图片

根据多选题判卷规则,全部选对得满分,部分选对得一半分,有选错不得分,表现最佳的是海螺AI(2道题全对,1道题部分对),其次是通义千问、文心一言和万知(1道题全对,2道题部分对)。

和单选题的情况类似,大模型们正确率最高的第8题是一道概念题:

X射线光电子能谱仪是利用X光照射材料表面激发出光电子,并对光电子进行分析的科研仪器,用某一频率的X光照射某金属表面,逸出了光电子,若增加此X光的强度,则( )
A. 该金属的逸出功增大
B. X光的光子能量不变
C. 逸出的光电子最大初动能增大
D. 单位时间逸出的光电子增多

第9题有两位选手选中了全部正确选项:海螺AI和万知。

图片

来看看万知的具体回答:

图片

今日份的测试,就先到这里,你觉得大模型们的表现如何?至少在这份物理卷子46分的选择题里,还是有不少选手能拿到及格分了。

图片

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
清华大学的精品AI人工智能课程的第8章主是循环神经网络。循环神经网络(Recurrent Neural Network, RNN)是一种用于处理序列数据的神经网络模型。相比于传统的前馈神经网络,RNN能够记住之前的信息,并将其传递到当前的状态中,这使得RNN在处理具有时间依赖性的数据时表现出优势。 在本章中,我们将深入理解RNN的工作原理和其应用。首先,我们会介绍RNN的基本结构,包括输入层、隐藏层和输出层。然后,我们会介绍循环结构的实现方式,包括Vanilla、LSTM和GRU等。接下来,我们会学习如何在文本生成、情感分析和语音识别等任务中应用RNN。此外,我们还会讨论RNN的一些常见问,例如梯度消失和梯度爆炸等,以及如何解决这些问。 在学习过程中,我们会通过一些示例和习加深对所学知识的理解。例如,在文本生成任务中,我们可以使用RNN生成一段新的文字,可以通过编写习来练习这个任务。同时,我们还会涉及到一些实际应用案例,例如用RNN进行自动写诗和实现智能聊天机器人等。 总之,清华大学精品AI人工智能课程第8章循环神经网络是一个全面而深入的学习资源,旨在帮助学生全面了解并掌握循环神经网络的基本原理、应用和解决方案。通过学习该章节,学生将能够在实践中灵活运用RNN进行序列数据处理,并解决相关问

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值