反直觉!一种新方法或让AI模型拥有“联想”力,甚至能识别从未见过的事物-1

滑铁卢大学的研究提出了一种新的机器学习方法——“少于一个”样本学习(LO-Shot Learning),使得AI模型能通过少量样本学习到大量类别,降低了对大量训练数据的依赖。研究受儿童学习过程启发,通过软标签和精心设计的样本,理论上限定模型可以识别远超训练样本的图像。尽管在深度学习等复杂模型上的应用仍具挑战,但这一理论为小样本学习提供了基础,对于计算机视觉和自然语言处理等领域有潜在的巨大影响。
摘要由CSDN通过智能技术生成

 

一种新的方法正在让人工智能模型获得人类的 “联想” 能力,甚至能让它识别此前从未见过的事物。

 

来自加拿大滑铁卢大学的博士生伊利亚(Ilia Sucholutsky)和他的博士导师马赛厄斯・尚劳(Matthias Schonlau)教授,首次提出了 “少于一次” 样本学习的概念和方法,并由此为人工智能技术的演进提供了新的思路。

 

相关研究论文于 2020 年 9 月发表在预印本网站 arXiv 上,名为 “'Less Than One'-Shot Learning: Learning N Classes From M < N Samples”。

 

伊利亚告诉 DeepTech,他们的研究显示,对于机器学习模型来说,理论上通过两个样本(example)即可训练模型学会识别任意数量类别(class)。

 

没人知道,这种方法一旦实现大规模应用,人工智能会迸发出怎样的火花。

 

高企的训练成本

 

机器学习,尤其是深度学习往往需要大量的训练数据。

 

著名的语言模型 GPT-3 使用了 45TB 的数据进行训练,这个过程耗资达到了惊人的 1200 万美元,即使有微软的鼎力相助,训练结束之后发现了一些小 Bug 也不舍得重新训练。

 

目前,GPT-3 是炼丹师们 “大力出奇迹” 的集大成者,但可以预见,不远的将来一定会有新的模型超越并取代它的位置。

 

“更多更大更强” 的思路是没有尽头的。假如我们稍稍停下疲于奔命的脚步,回归到现实中的人类学习过程,就会发现一个触及灵魂的拷问 ——人工智能真的必须依托如此巨量的数据才能够实现吗?

 

相信很多人的答案并不笃定。

 

举个例子,假如现在需要让人工智能模型 “认识” 马这种动物。常规的做法是挑选成百上千的马匹图像对其进行训练。

 

之所以需要如此之多的样本,是因为同样一匹马,仅仅是转换一个拍摄角度,或微调一些肉眼无法观察的像素点,人工智能就会识别失败,所以需要大量的大小、颜色、体态、朝向、品种不一的样本填满人工智能的 “盲区”。

 

即便如此,人工智能的识别成功概率也不能达到 100%,我们离创造真正可以复现大脑理解能力的人工智能还非常遥远。

 

但人类的儿童,却只需要一张看图识字的卡片,便能轻易分辨出唐僧所骑乘的是马,而不是其他外型类似的生物。并且,儿童一旦学会识别某种事物,这项技能终其一生都很难忘记,只会越来越熟练。

 

更有甚者,儿童可以在没有任何真实示例的情况下 “认出” 一个新的物体</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值