Intriguing properties of neural networks(ICLR2014)
这篇文章被认为是对抗样本的开山之作,首次发现并提出了对抗样本,作者阵容豪华,被引了很多次。但是文章的名字是《神经网络有趣的特性》,着重理解一下作者笔下神经网络的特性,特别是作者对对抗样本的解释,之后还有其他角度解释的文章。
对抗样本
文章通过求解以下优化问题找到对抗样本:
Minimize c ∣ r ∣ + loss f ( x + r , l ) subject to x + r ∈ [ 0 , 1 ] m \text { Minimize } c|r|+\operatorname{loss}_{f}(x+r, l) \text { subject to } x+r \in[0,1]^{m} Minimize c∣r∣+lossf(x+r,l) subject to x+r∈[0,1]m
其中 c c c是控制 ∣ r ∣ |r| ∣r∣的大小, r r r对样本 x x