Generating Adversarial Examples with Adversarial Networks 采用GAN的方法来生成对抗样本

最新推荐文章于 2023-09-22 11:03:01 发布

humuhumunukunukuapua

最新推荐文章于 2023-09-22 11:03:01 发布

阅读量1.8k

点赞数 3

分类专栏：机器学习文章标签：生成对抗网络GAN 对抗样本生成 Generating Adversarial Examp

本文链接：https://blog.csdn.net/weixin_39389001/article/details/103159717

版权

本文介绍了如何利用生成对抗网络（GAN）生成对抗样本，特别是针对黑盒攻击的情况。通过Adversarial GAN（AdvGAN），在不完全了解分类器的情况下，能够生成有效的对抗样本。文章探讨了对抗样本的概念、传统的生成方法以及它们的局限性，重点阐述了在GAN框架下如何结合分类器训练生成器，形成半白盒攻击。此外，还讨论了静态和动态蒸馏技术在黑盒攻击中的应用。

摘要由CSDN通过智能技术生成

AdvGAN
论文地址：https://arxiv.org/abs/1801.02610
论文的内容：采用GAN的方式来生成对抗样本

啥是对抗样本

对抗样本：adversarial examples
就是在真实样本的基础上加上一点点扰动，通常人眼无法察觉，但机器学习分类算法却会误判为其他类别～～
eg：大熊猫 + 很小的扰动量 ----结果判决成了长臂猿
最右边的图就是对抗样本。人眼看上去还是大熊猫，但是机器学习算法却分类错误。
在这里插入图片描述
数学描述
$||x_{adv}-x||,s.t.F(x_{adv})\neq y$
其中 $x$ 是真实样本，其类别是 $y$ . $F$ 是一个已经训练好的分类器网络。 $x_{adv}$ 就是对抗样本。最小化扰动量（两者的差异），使得分类器判决错误。
分类：
根据对抗样本的输出是否确定了类别：

有目标对抗—指定 $F(x_{adv})=y_{target}\neq y$
无目标对抗—只要分类错误就行 $F(x_{adv})\neq y$

根据对攻击网络 $F$ 的先验知识已知多少：

白盒对抗—需要知道网络的损失函数、梯度等
黑盒对抗—不需要网络内部知识

传统的对抗样本生成方法

大致分类：

基于梯度的方法
代表论文：
[1] Goodfellow I J, Shlens J, Szegedy C. Explaining and harnessing adversarial examples. ICLR 2015
[2] Kurakin A, Goodfellow I, Bengio S. Adversarial examples in the physical world. ICLR 2017
基本思路：把扰动加在梯度增加的方向，使得模型误判
基于优化的方法
代表论文：
[3] Szegedy C, Zaremba W, Sutskever I, et al. Intriguing properties of neural networks
[4] Nicholas Carlini, David Wagner. Towards evaluating the robustness of neural networks. 2017 IEEE Symposium on Security and Privacy (SP)
基本思路：求解优化问题，用各种变化方法使得优化问题好求解

缺点：
梯度方法快，但是不能保证对抗攻击有效
优化方法慢，一次只能对一个样本来优化