MIT最新研究:对抗样本才不是bug呢,人家,人家是特征~

MIT的一项新研究表明,对抗样本并非模型的怪癖,而是模型学习到的非稳健特征。通过构建错误标记的数据集进行训练,新模型在原始测试集上仍能保持一定的准确性,揭示了对抗样本的预测价值。研究提出,稳健和非稳健特征都可以预测,但非稳健特征可能导致对抗性,稳健模型可以通过限制输入的敏感特征来训练得出。
摘要由CSDN通过智能技术生成

大数据文摘出品

来源:gradientscience

编译:Andy


到目前为止,业内对于对抗样本的流行观点是,其源于模型的“怪癖”,一旦训练算法和数据收集方面取得足够的进展,那么它们终将消失。其他常见观点还包括,对抗样本要么是输入空间高维度的结果之一,要么是因为有限样本现象(finite-samplephenomena)。


而近日,来自MIT的几位研究员刚刚完成了一个最近的研究,它提供了一种对抗样本产生原因的新视角,并且,很有文学素养的研究员们尝试通过一个精妙的故事把这个研究讲个大家听。


一起来听听这个关于对抗样本的小故事。


一颗名为Erm的星球


故事始于Erm,这是颗遥远的星球,居住着一群被称为Nets(网)的古老外星人种。


Nets是一个神奇的物种;每个人在社会等级中的位置,取决于将奇怪的32×32像素图像(对Nets族来说毫无意义)分类为十个完全任意类别的能力。


这些图像来自于一个绝密数据集See-Far,除了看这些神奇的像素化图像以外,Nets的生活可以说完全是瞎的。


慢慢的,随着Nets越来越老,越来越聪明,他们开始在See-Far中发现越来越多的信号模式。他们发现的每个新模式都能帮他们更准确地对数据集进行分类。由于提高分类准确度的巨大社会价值,于是外星人们给最具预测性的图像模式都起了名,比如下图:


TOOGIT,一个高度指示“1”的图像,Nets们对TOOGIT异常敏感。


最强大的外星人非常善于发现这些模式,因此对这些模式在See-Far图像中的出现也很敏感。


不知何故(也许正在寻找See-Far分类提示),一些外星人获得了人类编写的机器学习论文,特别是其中一张图吸引住了外星人的眼球:


<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值