对抗样本生成算法-FGSM、I-FGSM、ILCM、PGD

最新推荐文章于 2025-05-10 16:23:28 发布

东方旅行者

最新推荐文章于 2025-05-10 16:23:28 发布

阅读量2w

点赞数 36

分类专栏：算法对抗样本文章标签：算法对抗样本

本文链接：https://blog.csdn.net/qq_43270828/article/details/120687085

版权

对抗样本生成算法

一、FGSM(Fast Gradient Sign Method)
二、I-FGSM/BIM(Iterative FGSM)
- - 1.I-FGSM与FGSM的区别
  - 2.I-FGSM算法流程
三、ILCM(Iterative Least-likely Class Method)
- - 1.ILCM与I-FGSM的区别
  - 2.ILCM算法流程
四、PGD(Projected Gradient Descent)
五、PGD与I-FGSM的区别

一、FGSM(Fast Gradient Sign Method)

1.FGSM基本思想

Fast gradient sign method缩写为FGSM，其思想来源于“随机梯度下降使得模型对于输入图像输出的损失函数值变小，从而使网络输出正确的预测，那么如果将计算得出的损失值加到输入图像上，使得网络输出的损失值变大，即可使网络趋向于输出错误的预测结果”。

2.FGSM算法流程

需要进行对抗样本生成的原始图片 $x_{ori}$ ，其标签为 $y$ ，一个良好的分类模型 $M$ ，分类模型 $M$ 的参数 $\theta$ ，同时需要使用FGSM生成一个攻击噪声 $\eta$ 。
首先使用分类模型 $M$ 对输出 $x_{ori}$ 进行一个前向传播，可以计算ß出损失函数值 $\nabla_{x_{ori}} J(\theta,x_{ori},y)$ ，因为损失计算得到的雅可比矩阵的元素大小不均，所以为了控制损失值的无穷范数（每一个像素的损失值的最大值），所以使用符号函数 $s i g n ()$ 提取梯度的方向，而不是用梯度的值，同时我们使用一个参数 $\varepsilon$ 来控制攻击噪声的幅值，满足 $\left \| \eta \right \|_\infty<\varepsilon$ 。

综上
$\eta=\varepsilon sign(\nabla_{x_{ori}} J(\theta,x_{ori},y)) \tag{1.1}$ 随后，将原图加上攻击噪声 $\eta$ 即可得到原始图片 $x_{ori}$ 的对抗样本 $x_{adv}$
$x_{adv}=x_{ori}+\eta \tag{1.2}$

最低0.47元/天解锁文章