Generating Adversarial Examples with Adversarial Networks 采用GAN的方法来生成对抗样本

本文介绍了如何利用生成对抗网络(GAN)生成对抗样本,特别是针对黑盒攻击的情况。通过Adversarial GAN(AdvGAN),在不完全了解分类器的情况下,能够生成有效的对抗样本。文章探讨了对抗样本的概念、传统的生成方法以及它们的局限性,重点阐述了在GAN框架下如何结合分类器训练生成器,形成半白盒攻击。此外,还讨论了静态和动态蒸馏技术在黑盒攻击中的应用。
摘要由CSDN通过智能技术生成

AdvGAN
论文地址:https://arxiv.org/abs/1801.02610
论文的内容:采用GAN的方式来生成对抗样本

啥是对抗样本

对抗样本:adversarial examples
就是在真实样本的基础上加上一点点扰动,通常人眼无法察觉,但机器学习分类算法却会误判为其他类别~~
eg:大熊猫 + 很小的扰动量 ----结果判决成了长臂猿
最右边的图就是对抗样本。人眼看上去还是大熊猫,但是机器学习算法却分类错误。
在这里插入图片描述
数学描述
m i n ∣ ∣ x a d v − x ∣ ∣ , s . t . F ( x a d v ) ≠ y min ||x_{adv}-x||,s.t.F(x_{adv})\neq y minxadvx,s.t.F(xadv)=y
其中 x x x是真实样本,其类别是 y y y. F F F是一个已经训练好的分类器网络。 x a d v x_{adv} xadv就是对抗样本。最小化扰动量(两者的差异),使得分类器判决错误。
分类:
根据对抗样本的输出是否确定了类别:

  • 有目标对抗—指定 F ( x a d v ) = y t a r g e t ≠ y F(x_{adv})=y_{target}\neq y F(xadv)=ytarget=y
  • 无目标对抗—只要分类错误就行 F ( x a d v ) ≠ y F(x_{adv})\neq y F(xadv)=y

根据对攻击网络 F F F的先验知识已知多少:

  • 白盒对抗—需要知道网络的损失函数、梯度等
  • 黑盒对抗—不需要网络内部知识

传统的对抗样本生成方法

大致分类:

  1. 基于梯度的方法
    代表论文:
    [1] Goodfellow I J, Shlens J, Szegedy C. Explaining and harnessing adversarial examples. ICLR 2015
    [2] Kurakin A, Goodfellow I, Bengio S. Adversarial examples in the physical world. ICLR 2017
    基本思路:把扰动加在梯度增加的方向,使得模型误判
  2. 基于优化的方法
    代表论文:
    [3] Szegedy C, Zaremba W, Sutskever I, et al. Intriguing properties of neural networks
    [4] Nicholas Carlini, David Wagner. Towards evaluating the robustness of neural networks. 2017 IEEE Symposium on Security and Privacy (SP)
    基本思路:求解优化问题,用各种变化方法使得优化问题好求解

缺点:
梯度方法快,但是不能保证对抗攻击有效
优化方法慢,一次只能对一个样本来优化

用GAN来生成对抗样本

推荐这篇blog来了解GAN,讲的非常好
https://blog.csdn.net/baidu_41867252/article/details/90369304

GAN是一种生成算法,目前在样本增强上有很多应用。
基本思路很简单:用噪声作为输入,送给生成器G,产生了虚假样本。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值