本文提出了ATN(Adversarial Transformation Network)方法来生成对抗样本。之前的许多方法都是利用梯度信息进行攻击,本文通过训练一个神经网络,将原图作为输入,输出为对抗样本。在给定原始输入的情况下,对分类器的输出进行最小的修改,同时限制新分类以匹配对抗目标类。
ATN神经网络可以被定义为:
θ \theta θ是神经网络的参数
f f f是目标网络
优化问题为:
L x L_{x} Lx是视觉损失
L y L_{y} L<
[paper]Adversarial Transformation Networks: Learning to Generate Adversarial Examples
最新推荐文章于 2022-06-24 19:27:23 发布
本文介绍了一种新的生成对抗样本的方法——Adversarial Transformation Networks(ATN)。ATN通过训练神经网络,从原始图像生成对抗样本,以最小化修改分类器输出并确保分类匹配目标。ATN包括Perturbation ATN(P-ATN)和Adversarial Autoencoding(AAE)两种方式,其中P-ATN保留更多原始像素,而AAE可能会去除高频信息。不同方法生成的对抗样本具有不同的特性,并且多网络训练的ATN具有更好的泛化能力。
摘要由CSDN通过智能技术生成