论文学习笔记：通用对抗扰动UAP

最新推荐文章于 2024-11-27 17:00:06 发布

weixin_40675092

最新推荐文章于 2024-11-27 17:00:06 发布

阅读量2k

点赞数 4

分类专栏：对抗样本文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_40675092/article/details/120249532

版权

对抗样本专栏收录该内容

4 篇文章

订阅专栏

给定一个state-of-the-art的深度神经网络分类器，作者的工作展示了通用对抗扰动(UAP)的存在性，并且提出了计算UAP的方法。经验型的解释了这种扰动，展示了UAP在不同神经网络之间的泛华性。UAP的存在揭示了高维决策边界之间存在重要的几何相关性。进一步概述了现有自然图像分类器存在安全漏洞。
在这里插入图片描述

UAP

假设图片 $\in \mathbb{R}^d$ 来自分布 $\mu$ ，注意，这里的 $\mu$ 分布，代表了大部分的自然图片，包含较强的多样性。在这样的情况下，我们要找到通用对抗扰动 $v$ ，需要 $v$ 满足一下两个条件。
在这里插入图片描述
其中， $\xi$ 表示扰动的幅度， $\delta$ 表示对分类模型 $\hat{k}$ 的愚弄率。

在这里插入图片描述
对于来自 $\mu$ 分布的图像数据点 $X$ ，作者提出了在数据集上迭代，逐步创建通用对抗扰动 $v$ 的方法，在每次迭代计算中，计算将 $x + v$ 推动到分类边界上的最小的 $\Delta v_i$ 。如上图2，数据点 $x_1$ ， $x_2$ ， $x_3$ 叠加，3个不同的颜色分别表示不同的分类区域 $\mathscr{R_1}, \mathscr{R_2}, \mathscr{R_3}$ 。算法不断计算把当前扰动点 $x_i + v$ 推送到分类边界 $\mathscr{R}_i$ 的最小扰动，其实也就是到决策边界最小距离(DeepFool)，并把这个最小扰动聚合到当前扰动点上。

在这里插入图片描述
详细的讲，假如uap $v$ 没有在数据点 $x_i$ 愚弄到分类器，计算讲扰动点 $x_i + v$ 推送到分类决策边界的最小扰动 $\Delta v_i$ （这里是不是很像deepfool），并将 $KaTeX parse error: Undefined control sequence: \Delata at position 1: \̲D̲e̲l̲a̲t̲a̲ ̲v_i$ 更新到uap $v$ 上，注意这里的更新并不是简单的加和，为了保持 $||v||_p <= \xi$ 始终成立，将更新后的普遍扰动进一步投影到半径为 $\xi$ 并以 0 为中心的 p 球上。以此来提升uap $v$ 的愚弄效果。
在这里插入图片描述
在添加uap得到数据集 ${x_1 + v, x_2 + v, ..., x_n + v\}$ ，当新生成的数据在分类模型上的”愚弄率“大于阈值 $\delta$ 时，算法终止。事实上，并不需要很大的数据 $X$ 来计算在整个 $\mu$ 分布上的图像的uap