对抗样本生成算法之FGSM算法

最新推荐文章于 2023-11-30 11:30:00 发布

学-evday

最新推荐文章于 2023-11-30 11:30:00 发布

阅读量5k

点赞数 7

分类专栏：对抗样本文章标签：深度学习

本文链接：https://blog.csdn.net/ilalaaa/article/details/105963778

版权

对抗样本专栏收录该内容

13 篇文章 17 订阅

订阅专栏

背景

-对抗样本的线性解释
对于线性模型， $f(x)=w^Tx+b$ ，对原始样本 $x$ 添加扰动 $\eta$ 得到对抗样本 $\bar{x}=x+\eta$ 。为确保干扰是微小的，利用 $||\eta||_\infty<\epsilon$ 进行限制。
添加噪声后，模型输出为 $f'(x)=w^T\bar{x}+b=w^Tx+w^T\eta+b$ 。 $w$ 为权重向量，如果 $w$ 具有n维度，并且每一维度的平均大小为 $m$ ，则激活将增长 $m n$ 。最后的扰动为 $w^T\eta<=\epsilon*n*m$ ，虽然 $\epsilon$ 的值很小，但当 $w$ 的维度很大时， $nm\epsilon$ 将会是一个很大的值，足以引起分类器分类错误。由于 $||\eta||_\infty$ 不随维度而增长，但由 $\eta$ 扰动引起的激活变化可随着 $n$ 线性增长，对抗性扰动使激活度增加 $w^T\eta$ 。

-作者猜测观点
作者认为，神经网络容易受到对抗性扰动影响的主要原因是它们的线性性质。高维空间中的线性行为足以引起对抗样本。
以上的线性解释是基于线性模型而言的，但DNN一般是高度非线性模型。DNN的非线性单元赋予了其强大的表达能力，但非线性单元的存在会降低学习效率。为提高学习效率，需要对非线性单元进行改进，通常做法是通过降低其非线性来实现。从而，非线性单元的线性行为不断增强，导致DNN的线性能力增强，因此导致对抗样本的存在。
对于高纬问题，我们可以对输入进行许多无穷小变化，从而对输入进行了大的变化。这些解释表明，如果简单线性模型的输入具有足够的维数，则可以具有对抗样本。

原理

FGSM(Fast Gradient Sign Method)是一种基于梯度生成对抗样本的算法，这是一个单步（one-step）的、非定向（non-targeted）的攻击算法。。其目标是最大化损失函数来获取对抗样本。

深度神经网络的训练，是追求损失函数最小化的过程。在求损失函数的最小值时，我们会沿着梯度的反方向移动，使用减号，即梯度下降算法。而FGSM算法可理解成梯度上升算法，即沿着梯度的方向移动，使用加号，求得损失函数的最大值。
FGSM样本生成
原始图像 $x$ ，扰动值 $\eta$ ，对抗样本 $x+\eta$ 。在扰动值的计算中，用到了 $s i g n$ 符号函数，保证了变化方向同梯度方向方向一致。 $J$ 是用来衡量分类误差的损失函数。 $\theta$ 为模型参数， $x$ 为模型输入， $J(\theta,x,y)$ 为训练神经网络的成本， $\nabla_x$ 为对 $x$ 求导。
$\eta=\epsilon*sign(\nabla_xJ(\theta,x,y))$
$\epsilon$ 的值通常是人为设定，但小于某一阈值，一旦扰动值超出阈值，该对抗样本会被人眼识别。梯度是使用反向传播算法计算得到的。