【总结】Obfuscated Gradients give a false sense of security:circumventing defenses to adversaria..

《Obfuscated Gradients give a false sense of security:circumventing defenses to adversarial examples》

相关文献

1、神经网络对于对抗样本的敏感性:
Szegedy et al. 2013
Biggio et al. 2013
2、iterative optimization-based attacks
Kurakin et al. 2016a
Madry et al. 2018
Carlini & Wagner 2017c
3、gradient masking
Papernot et al. 2017
4、Expectation Over Transformation
Athalye et al. 2017
5、ResNet
Zagoruyko & Komodakis, 2016
He et al. 2016
6、backpropagation
Rumelhart et al. 1986
7、降噪去对抗干扰
Guo et al. 2018
避开这种防御:Carlini & Wagner, 2017b
8、

三种obfuscated gradients:

shattered gradients:破碎梯度,产生于有意的不可导操作或者无意间数值不稳定造成
stochastic gradients:随机梯度取决于测试时间的随机性
vanishing/exploding gradients:梯度消失、梯度爆炸,很深的计算中产生的无用梯度

Attack Techniques

1、Backward Pass Differentiable Approximation (BPDA)
因为 g(x)x g ( x ) ≈ x ,
所以 xg(x)xx=1 ▽ x g ( x ) ≈ ▽ x x = 1
所以 xf(g(x))|x=x^xf(x)|x=g(x^) ▽ x f ( g ( x ) ) | x = x ^ ≈ ▽ x f ( x ) | x = g ( x ^ )

BPDA:
g(x)fi(x) g ( x ) ≈ f i ( x ) 只在backward pass上用 g(x) g ( x ) 代替 fi(x) f i ( x ) , 发现比forward和packward都替换的效果好得多
可以用来解决shattered gradients

2、Expectation over Transformation
用Expectation over Transformation来正确计算输入所期望的转变的梯度,来对抗让输入随机转变的防御

3、Reparameterization
solve vanishing/exploding gradients
make x=h(z) x = h ( z ) 使得 g(h(z))=h(z) g ( h ( z ) ) = h ( z ) h() h ( · ) 是可微的,这样,可以通过 f(h(z)) f ( h ( z ) ) 来计算梯度

Case study

1、Non-obfuscated Gradients
(1) adversarial training
用对抗样本训练,直到能正确分类
给定训练数据 X X 和损失函数 l(·), 一般的训练是选择参数

θ=argθminExXl(x;Fθ) θ ∗ = a r g θ m i n E x ∈ X l ( x ; F θ )

而对抗训练解决
θ=argθminExX[maxδ[ϵ,ϵ]N l(x+δ;Fθ)] θ ∗ = a r g θ m i n E x ∈ X [ m a x δ ∈ [ − ϵ , ϵ ] N   l ( x + δ ; F θ ) ]

(不太懂)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值