AI 竟然通过了初中生考试!?这意味着什么?

全世界只有3.14 % 的人关注了

青少年数学之旅

640?wx_fmt=jpeg

2016 年 AlphaGo 战胜世界棋王李世石,被认为是人工智能一个重要的里程碑。
此后 AlphaGo 又击败了世界排名第一的围棋选手柯洁,AI 也在德州扑克、Dota 2 等游戏上战胜了专业的人类玩家,越来越聪明的 AI 甚至开始让人类心生畏惧。
640?wx_fmt=jpeg
▲ 柯洁与 AlphaGo 对战.
然而,这些 AI 表面上聪明,实际上连初中生的考试都不能及格。
据《纽约时报》报道,最近西雅图著名的艾伦人工智能研究所终于取得了一项新的突破,其推出的一个 AI 系统通过了八年级(相当于中国初二)的科学考试,正确回答了 90% 以上的问题,而在十二年级考试(相当于中国高三)也正确回答了超过 80% 的问题。
你可能会说,不就是中学生考试吗?对于连顶尖围棋选手都能打败的 AI 来说,有什么了不起的。
实际上这些中学试题不只是很多学生的痛苦回忆,也是 AI 的难以企及的高度。
640?wx_fmt=jpeg
▲ 图片来自:《垫底辣妹》
就在 AlphaGo 击败李世石那一年,艾伦人工智能研究所也举办了另一场关于 AI 的竞赛,邀请世界各国共 800 个研究团队来开发一个能通过八年级科学考试的 AI 程序。
结果得分最高的一个 AI 程序,也只能正确回答 59% 的问题,也就是不及格 ,是个十足的差生了。
有那么难吗?
按照我们中国学生的应试教育思维,题海战术灌啊,理解不了就死记硬背,反正 AI 的记忆要比人类好太多,也能储存更多数据。
640?wx_fmt=jpeg
▲ 图片来自:纪录片《高三》
然而这些 AI 要面对的八年级试题并不是简单的问答,比如「眼镜是通过哪个部分接收光线」这样的题,而是要将多个概念结合并进行一定逻辑思考的问题,在 2016 年的测试中就有这样一题:
640?wx_fmt=png
一些鱼类成年后一直生活在咸水中,但却能在淡水中产卵,它们可以在不同环境中生存的能力是[什么]的例子?
此外测试中还有多选题,尽管AI 拥有先进的深度神经网络等技术,但还是很难回答这些问题, 艾伦人工智能研究所 CEO Oren Etzioni 解释了这背后的原因:
640?wx_fmt=png
这涉及到自然语言理解,需要学习并理解教科书的意思,要正确回答这些问题需要更多的推理,因此这这个挑战的难度也更高。
简单来说,AI 做不好八年级测试是因为无法理解人类的阅读和理解模式,相反如果 AI 能在这些考试中取得高分,就意味着 AI 像人类一样思考的能力更强了。
640?wx_fmt=jpeg
▲图片来自:wired
在最新的测试中,艾伦人工智能研究所使用的一个叫做 Aristo 的 AI ,这套系统是在 Google AI 团队开发的语言表征模型 Bert 基础上改进的,Bert 在学习维基百科的资料库和数字图书馆的大量书籍后,阅读理解能力取得了重大进步,其中两项指标更远超过人类。
640?wx_fmt=jpeg
▲ 图片来自:medium
Bert 模型也被认为是自然语言处理(NLP)的一个重要历史突破,Bert 可以通过分析文本来推断句子中缺失的单词。
而进化版的 Aristo 在经过一段时间的学习后,已经可以自己回答一些复杂的问题。这次的测试题目同样要考验的 AI 的逻辑分析能力,比如下面这道选择题:
640?wx_fmt=png
哪种变化最可能导致生活在某个地区的松鼠数量减少?
(1)捕食者数量减少
(2)松鼠之间的竞争减少
(3)可获得的食物增加
(4)森林火灾次数增加
这个问题的答案并不存在于某个数据库中可以让 AI 死记硬背,而是要通过分析找到选项之间的联系,比如火灾的增加会直接杀死松鼠,也可能导致减少松鼠繁殖和生存所属的食物数量。
这一次 AI 已经能自主思考这样的问题并给出正确答案,那是否意味着机器很快就可以像人类一样思考呢?很遗憾,尽管 AI 在自然语言处理上取得了新的突破,但这只是人类理解能力的皮毛。
AI 一思考,人类就发笑,现阶段人类依然是 AI 的上帝。目前人工智能还是处于弱人工智能(Artificial Narrow Intelligence )阶段:拥有强大的计算能力,但只在某方面强于人类,比如 Siri 和 AlphaGo。
640?wx_fmt=jpeg
▲ 图片来自:《爱,死亡和机器人》
而艾伦人工智能研究所的这些研究,就是尝试将 AI 朝着强人工智能(Artificial General Intelligence)发展,届时 AI 甚至能拥有人类的批判性思维和抽象思维思考问题。
前几天曝光的全球首个「数字人类」AndyBot ,将人的样貌、声音、记忆等众多信息与 AI 结合保存在云端,让亲人去世后依然可以与自己交谈。
640?wx_fmt=jpeg
▲Andrew Kaplan 同意成为第一个「数字人类」
不过,这不是《黑镜》第三季的「圣朱尼佩洛」,人类可以将自己的意识上传到服务器,实现在云端的永生。你与之对话的「数字人类」,只是 AI 根据之前数据分析后进行模拟的。
640?wx_fmt=jpeg
▲ 图片来自:《黑镜》
对于这样的产品, AI 对于自然语言的理解,或者是能不能像人类一样思考,就至关重要了。开发「数字人类」的 Fable 公司首席执行官 Edward Saatchi  表示,要让计算机像人类处理多回合对话,即使不是几十年,也需要数年时间。
因此他认为现阶段更现实的目标,还是让数字人能够分享关于他的一生的故事。如果 AI 真的掌握思考能力,那么完全可以通过 AI 「克隆」一个人,这个「数字克隆人」也许能替代我们完成很多繁琐的工作,也可能像科幻电影里一样反抗人类。
尽管这样的未来还很遥远,但我们的确在让 AI 的思考能力越来越强。
参考来源:黑科技数据
版权归原作者所有,转载仅供学习使用,不用于任何商业用途
如有侵权请留言联系删除,感谢合作

640?wx_fmt=png

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

写在最后

微信公众号“少年数学家”
提供丰富的数学课外知识
数学人物、数学趣谈、科技与数学

想让孩子懂得更多有趣的数学
记得关注“少年数学家”
深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值