ADVERSARIAL EXAMPLES IN THE PHYSICAL WORLD

最新推荐文章于 2022-02-24 19:39:38 发布

MTandHJ

最新推荐文章于 2022-02-24 19:39:38 发布

阅读量965

点赞数

分类专栏： neural networks

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MTandHJ/article/details/105936065

版权

neural networks 专栏收录该内容

143 篇文章 6 订阅

订阅专栏

文章目录

Alexey Kurakin, Ian J. Goodfellow, Samy Bengio, ADVERSARIAL EXAMPLES IN THE PHYSICAL WORLD

概

有很多种方法能够生成对抗样本(adversarial samples), 但是真实世界中是否存在这样的对抗样本呢?

主要内容

least likely class adv.

假设 $X$ 为图像(各元素取值为 $[0, 255]$ ), $y_{true}$ 为其标签, $f (X)$ 为一模型, 其输出是一个概率向量, 定义
$y_{LL}:=\arg \min_i \{f(X)_i\},$
故本文的生成adversarial samples的方法是最小化
$J(X,y_{LL}):=-\log f(X)_{y_{LL}},$
则
$X_0^{adv}=X,\quad X_{N+1}^{adv}=Clip_{X,\epsilon} \{X_N^{adv} - \alpha \mathrm{sign}(X_N^{adv},y_{LL})\}，$
其中
$Clip_{X,\epsilon}(X'):=\min \{ 255,X+\epsilon, \max\{0,X-\epsilon, X'\} \},$
即使得 $X^{'}$ 落入 $[0, 255]$ 内且, $\|X-X'\|_{\infty} \le \epsilon$ .

实验1 l.l.c. adv.的效用

对l.l.c. adv. 和 fgsm, ifgsm进行了比较
在这里插入图片描述

实验二

为了探究真实世界是否也存在这样的对抗样本, 作者将图片进行如下操作:

打印 ( a )
用手机将打印的照片拍照 ( b )
对照片进行裁剪找出所需的部分 ( c )

在这里插入图片描述

可以把这种操作看成一个变换 $\rightarrow T(X)$ , 如果真实世界中也存在对抗样本, 那么原本的adversarial samples 在经过这个变换之后很有可能也具有对抗的性质, 事实上, 实验显示的确, 虽然其对抗的程度有些许下降.

作者构建了一个指标(重构率)来衡量:
在这里插入图片描述
其中

$\overline{C(X,y)}=1-C(X,y)$ .

$d$ 表示经过变换 $T$ 后, adversarial samples 变成普通样本(即不被误判)的比例, 实验显示, 在实验一中表现出色的l.l.c. adv., $d$ 反而比较高, 作者猜测这是因为这个方法产生的扰动比较精细, 经过 $T$ 变换后, 这部分扰动就容易被抵消.

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。