【论文笔记】Generating Natural Adversarial Examples

最新推荐文章于 2024-05-03 11:31:51 发布

favorbanana

最新推荐文章于 2024-05-03 11:31:51 发布

阅读量1.5k

点赞数 3

分类专栏：机器学习安全文章标签：深度学习

本文链接：https://blog.csdn.net/crystal_sugar/article/details/105970162

版权

4 篇文章 0 订阅

订阅专栏

Generating Natural Adversarial Examples. Zhengli Zhao, Dheeru Dua, Sameer Singh. ICLR 2018. decision[pdf][code]

贡献

GAN
在这里插入图片描述

在这里插入图片描述

举例说明（使用算法1）
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
要点：

引入 $i n v e r t e r$ （逆变器）。利用 $W G A N$ 策略训练出生成器 $G$ ，借助生成器训练逆变器 $I$ 。 $I$ 是 $G$ 的反向过程： $X — — > Z$
输入空间&语义空间。不直接对输入样本进行扰动，而是借助隐层空间 $Z$ 。样本 $x$ 通过逆变器 $I$ 映射到该空间得到 $z^{'}$ ，对 $z^{'}$ 进行随机扰动得到 $z$ ^，然后通过生成器 $G$ 得到 $x$ ^{^}，使分类器原始标签发生变化。选择最接近 $z^{'}$ 的 $z$ ^记作 $z *$ 。则对抗样本 $x * = G (z *)$ 。
随机扰动。提出两个搜索算法。算法一是由近及远进行搜索，每次按delta $r$ 扩大搜索范围。一次迭代随机采样 $N$ 个扰动，迭代次数越靠前与原样本的相似度就越高。该算法效率低。算法二是由远及近，每次迭代都要缩紧采样上界。在每次迭代中使用二分策略调整采样下界。该算法速度4倍于算法一，效果近似。但计算代价仍然高。
引入自编码器对离散的文本数据进行处理。编码成连续代码，解码成离散文本。
黑盒环境下，通过无标注的数据集衡量模型的鲁棒性（准确地说是准确率）。

思考：

关注