AI大模型参加今年高考·成绩单来了!

图片

2024高考落幕,各家AI纷纷交卷,今天聊聊高考中的AI。

毫无悬念,今年的高考,成了各家大模型的竞技场。几乎所有的国产大模型,都把高考题目当成了跑分工具。那么,这些AI表现怎么样呢?前两天,搜狐科技和量子位等几家媒体做了个统计。

在数学上,得分前三名是百度的文心一言、字节的豆包,还有科大讯飞的星火。这三个大模型并列第一,答案正确率都是63%。而剩下的几家大模型,答题正确率都没有超过51%。
😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

在物理上,阿里的通义千问和讯飞的星火并列第一,正确率都是71.4%。排在后面的是Kimi、海螺和腾讯元宝。

今年的作文题,估计很多人都看过了,大部分人群最关心的还是AI作文考试。

新课标1卷的题目是,随着互联网的普及以及人工智能的应用,越来越多的问题能更快获得答案。那么,我们的问题是否会越来越少?

新课标2卷的题目是,随着嫦娥四号探月和天问一号出发,人类的脚步正在不断抵达未知之境。这引发了你怎样的思考?

那么,在这些题目上,AI完成得怎么样呢?按照满分60分算的话,AI的分数普遍在50分上下,各家大模型的差距并不大。这些AI作文也请专业的语文老师看了,按照他的说法,这些作文给人的感觉,就像在吃各式各样的、形状不同的馒头。没错,尽管形状不同,但你懂的,大概就是那个差不多的味道。你挑不出什么毛病,也找不出太大的亮点。去年我们曾经让AI写过2023年的高考作文,现在一年过去,AI的进步确实有。只不过,这个进步的点在于,馒头比去年更精致了,但馒头还是馒头。

有人认为这是大模型进展不够快,也有人觉得是高考题目难度大。关于今年的作文题,我特地请教了北京十一学校语文教研组的组长,史建筑老师。史老师有很多年的语文教学经验,在作文方面更是专家。从他那获得了一个很特别的角度。

其实今年的高考作文是不好用难易来评判的。今年的变化,不是难度上的变化,而是命题思路上的变化。今年的作文题,在整体的思辨,以及逻辑思维的考察上,要比往年有强化。这是个很有价值的转变。正在慢慢纠正那些只讲气势,堆大词,不讲逻辑的文风。

按照个人理解,这背后本质的转变,其实是作文考试正在从资源导向,转变成能力导向。

所谓资源导向,就是不停地往上堆资源。就像炒菜做饭,追求的只是把珍贵的食材凑齐。而体现在作文上,就是不停地堆要素。比如,情感充沛、成语丰富、引经据典。既然这些都属于加分要素,我就把这些要素堆上去,就能拿到一个不低的基础分。

据说在网上,还流传着一个万能作文模板,叫做我的爷爷。

比如,前年的作文题之一是,围棋中的本手、妙手、俗手引发了你怎样的思考,请写一篇文章。那么按照我的爷爷模板,写出来就是看到围棋中的本手、妙手、俗手,我想到了我那爱下围棋的爷爷。爷爷这一生怎样怎样。

再比如,去年的作文题,其中有一个是,故事的力量。按照爷爷模板,写出来就是,看到故事,我就想起了我那特别喜欢讲故事的爷爷。爷爷这一生是怎样怎样的。

当然,这个万能模板只是个玩笑,但它其实也展示了一个可能性。这就是,假如一件事是纯粹的资源导向,那么它就有可能走到这个高度同质化的死胡同。

怎么办?这就是高考作文这几年正在做的转变,从资源导向,转向能力导向。也就是考察的重点,不是学生堆大词、背成语,发表感叹的能力,而是学生的辩证思考能力。

你之所以觉得这两年AI写的作文一般,就是因为AI的写作方式,还停留在堆资源的阶段。但实际的作文题,已经越来越多地把重点放在学生的思辨能力上。

在早前发布的消息中,也强调了这个变化。比如,在高考最卷的省份之一山东,今年的高考命题,按照教学专家的说法,是强调四个无,分别是,无价值,不入题。无思维,不命题。无综合,不命题。无情境,不成题。这些说的都是高考命题将越来越看重学生的辩证思考能力,以及解决真实挑战的能力。

比如今年的作文题,AI能回答越来越多的问题,那么人类的问题是否会越来越少?你看,这个题目要想拿高分,靠堆大词肯定不行,而是要有特别的思考。

其实,跳出高考这个话题之外,你会发现,很多领域的变化,都遵循着相似的过程,从资源导向,转向能力导向。

比如,新闻传播学。去年张雪峰说新闻学是天坑专业,在网上引起了不小的争论。为什么会产生这个争论?本质原因之一,是传播领域发生了一个关键变化。它正在从一个资源导向的行业,逐渐变成能力导向的行业。

为什么说传播领域以前是资源导向?因为早些年,传播资源非常稀缺。电视上的频道就那么几个,市面上也没有互联网。而当年只要上一回电视,没准就能改变一个普通人一生的命运。你看,在传播资源这么稀缺,这么珍贵,这么威力十足的情况下,假如你要培养这个行业的从业者,你觉得最重要的是什么?没错,最重要的课题之一,就是培养他们深刻认识、小心驾驭、谨慎对待这些资源的能力。包括,怎么建立一套严谨的流程,怎么做好极其细致的前期策划,以及了解这个行业的过往历史,等等。

但是最近十几年,自媒体和移动互联网快速普及,传播资源变得不再稀缺。这时,传媒行业的价值也发生了转变,而部分学校的传播学专业还没来得及完全调整,因此争论就发生了。

原来传播行业的本质是,比原来广,它的主要价值在于,让一个信息比原来传播得更广被更多的人知道。

而现在传播行业的本质是,比原来好。也就是,一个信息大家都知道,但我能让它变得比原来更有价值。要么是变得更简单易懂,更好吸收。要么是变得角度独特,更有深度。

这时,考验的就不是从业者守护资源的能力,而是创造性地使用资源的能力。

换句话说,能力和资源的关系,也许跟我们想象得不太一样。过去很多人觉得,这两个因素的关系是此消彼长,只要资源充足,能力差点没事。反过来,只有资源不足,才会倒逼能力成长。但事实上,这两个因素很多时候是正相关的。资源越充足,越需要强大的能力驾驭。就像高考作文一样,当大家都掌握充沛的成语、典故和写作套路时,要想拉开差距,就要看谁更能用强大的思考能力,来驾驭这些资源。

总结:

从AI高考作文得分情况可以看出,高考作文正在发生转变,**最核心的变化之一,是从资源导向,转向能力导向。**过去有考生习惯堆资源,堆大词,但未来,考试的重点将转向学生的辩证思考能力,AI的进化也要跟上脚步。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

  • 33
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
AI模型赋能人形机器人可以被视为迈向通用人工智能的一大步。人形机器人是一种能够模拟人类外貌、行为和交流的机器,结合AI模型的能力,可以实现更高级别的人工智能功能。 首先,AI模型的强大计算能力和学习能力使得人形机器人能够更加准确地理解和模仿人类的动作和表情。通过对大量数据的学习,AI模型能够理解并推断人类的情绪、意图和行为,从而更好地与人类进行交互和沟通。这种与人类的自然交流方式可以让机器人更好地融入人类社会,满足人类的各种需求。 其次,AI模型赋能的人形机器人在应用领域具有广泛的潜力。例如,在医疗领域,人形机器人可以通过感知和理解病人的情绪和需求来提供情感支持和护理服务。在教育领域,人形机器人可以根据学生的学习情况和兴趣定制教学内容,提供个性化的教育体验。在服务行业中,人形机器人可以担任引导员、导游员等角色,为人们提供导航和咨询服务。 最后,AI模型赋能的人形机器人还有助于推动人工智能技术的发展和创新。通过将大模型与机器人相结合,各种新的应用和功能不断涌现出来。同时,人形机器人的使用也可以促进对于伦理、隐私和安全等相关问题的讨论和解决。 总的来说,AI模型赋能人形机器人是迈向通用人工智能的一大步。它能够实现更加准确和自然的人机交互,拓展人工智能在各个领域的应用,并推动人工智能技术的发展和创新。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值