这些越来越大的网络是否最终达到了人类的常识性理解?同样,这也是不可能的。WinoGrande的结果有一些重要的注意事项。例如,由于这些句子依靠的是亚马逊Mechanical Turk的工人,写作的质量和连贯性相当不平衡。另外,用于剔除 "非谷歌认证 "句子的 "不成熟 "的人工智能方法可能太不成熟,无法发现一个巨大的神经网络所能使用的所有可能的统计捷径,而且它只适用于个别句子,所以剩下的一些句子最终失去了 "双胞胎"。
一项后续研究表明,只对双胞胎句子进行测试的神经网络语言模型--并且要求在这两个句子上都正确--其准确度远远低于人类,这表明早先90%的结果并不像看上去那么重要。
那么,该如何看待Winograd的传奇故事呢?主要的教训是,通常很难从它们在特定挑战上的表现来确定人工智能系统是否真正理解它们所处理的语言(或其他数据)。我们现在知道,神经网络经常使用统计学上的捷径--而不是真正表现出类似人类的理解力--来获得Winograd模式以及许多最流行的 "一般语言理解 "基准的高绩效。
在我看来,问题的关键在于,理解语言需要理解世界,而只接触语言的机器无法获得这种理解。考虑一下理解 "跑车超过了邮车,因为它走得比较慢 "意味着什么。你需要知道什么是跑车和邮车,汽车可以相互 "超越",而且,在更基本的层面上,车辆是存在于世界上并相互作用的物体,由人类驾驶,有他们自己的议程。
所有这些都是我们人类认为理所当然的知识,但它并没有内置于机器中,也不可能明确地写在任何语言模型的训练文本中。一些认知科学家认为,人类为了学习和理解语言,依赖于先天的、语言前的关于空间、时间和世界的许多其他基本属性的核心知识。如果我们想让机器同样掌握人类的语言,我们将需要首先赋予它们人类天生的原始原则。而为了评估机器的理解力,我们应该从评估它们对这些原则的掌握开始,人们可以称之为 "婴儿形而上学"。
与沃森和GPT-3等人工智能系统的惊人功绩相比,训练和评估机器的婴儿级智能似乎是一个巨大的退步。但是,如果真正的和值得信赖的理解是目标,这可能是通向机器的唯一途径,它们可以真正理解 "它 "在句子中指的是什么,以及理解 "它 "所带来的其他一切。
让机器同样掌握人类的语言,需要首先赋予它们人类天生的原始原则
最新推荐文章于 2024-07-20 06:19:20 发布