1、论文思路
使用三种数据集Minist,ImageNet和YouTube中的图片,对应三种网络结构,说明神经网络的反直觉特性。
三种网络结构:
FC:多个隐含层和一个softmax;
AlexNet;
QuocNet:具有10亿个可学习参数的无监督训练网络。
2、反直觉特性
(1)单个神经元和神经元线性组合没有区别,最后一个特征层构成区别的基础。
(2)输入输出映射不连续,优化扰动可以最大化预测误差。相同的扰动造成不同的网络,输入相同,输出不同。小的扰动具有稳定性,优化扰动能产生对抗样本。
3、方法
在网络自然基础方向和随机方向添加扰动。
L-BFGS:寻找最小的损失函数添加项,使得神经网络做出误分类,其中标签l,扰动r,分类函数f
4、实验结果
5、结论
对抗样本与常规例子难以区分,因而产生对抗样本。对抗样本出现的比较密集,都在测试用例附近,与干净样本差别小,因而对抗性好。
6、不足
本文没有深入研究产生对抗样本的频率,即对抗样本以小概率在模型中产生,没有总结如何来产生稳定的对抗样本。
注:本文粗读,方法没有深入去读。