可迁移注意力攻击(TAA)

关注公众号,发现CV技术之美

本文分享论文『Push & Pull: Transferable Adversarial Examples With Attentive Attack』,提出一种可迁移注意力攻击,不仅提高了对抗样本的可迁移性,而且保持了较高的白盒目标攻击成功率。

详细信息如下:

18690ec3dd112f1b0536ebd662973b0c.png

  • 论文链接:https://ieeexplore.ieee.org/document/9430730

      01      

引言

该论文是关于对抗样本可迁移性的文章。在该论文中,作者提出了一种可迁移注意力攻击(),该方法基于关注图像特定区域和特征对干净图像进行对抗扰动。另外,作者还将三元组损失函数引入到对抗样本的生成策略中,在攻击过程中干净图像被迭代地“推”离源类,同时随着攻击进行“拉”近到目标类,以实现对抗样本较高的可迁移性。实验结果表明,该方法不仅提高了对抗样本的可迁移性,而且保持了较高的白盒目标攻击成功率。

      02      

背景知识

 最先提出使用梯度信息在白盒条件下生成对抗样本的攻击方法:

其中表示一个干净样本,为对抗扰动的大小,表示真实地标签。对抗样本是沿着损失函数关于样本的梯度的符号方向一步生成的。随之也演变出了一系列的方法,如,,等。

 等人通过扩展单步方法,并提出了迭代版本方法,即多次在梯度方向上进行迭代生成对抗样本,具体的形式如下所示:


402 Payment Required

其中,为攻击迭代次数,可以大大提高白盒攻击的成功率。

 等人提出了一个基于动量迭代攻击方法以此来提高对抗样本的迁移性,具体的公式如下所示

402 Payment Required

其中动量会积累前次迭代的动量信息,其中衰减因子为。除此之外,Xie等人提出了一个新的方法,并首次在每次迭代中将随机变换应用到输入样本中。图像变换包括随机调整大小和填充,这会产生比以前的攻击方法具有更高迁移性的对抗样本。

除了基于的攻击方法之外,还提出了其他类型的生成对抗样本的方法。通过找到从干净样本到决策边界最近距离来生成对抗样本。方法基于优化的方式攻击带有蒸馏防御的模型,具体的优化形式如下所示:

402 Payment Required

其中表示目标类,表示函数,常数集被用于二分查找,是一个常数控制置信度。

      03      

论文方法

在该论文中,作者提出一种新的黑盒有目标攻击,即可迁移注意力攻击(),该方法也可以对白盒模型进行攻击。

402 Payment Required

是一个分类器,该分类器将输入样本 映射到输出 ,其中 表示的是干净样本 的真实标签。无目标攻击的目标是找到一个对抗样本 ,并且使得 ;有目标攻击的目的是误导分类器去预测为有目标类别 ,并且 。

为了使生成的对抗样本不可察觉,会对扰动进行约束,即,其中表示范数,一般情况下,的取值为,,,。在该论文中,作者采用三元组损失函数,它不仅可以最小化锚点样本与正样本之间的距离,并最大化锚点样本和负样本之间的距离,通过优化特征空间上的三元组损失函数来扰动图像信息和判别区域。 将一张图像映射为第层的隐向量。

这里的损失函数利用三元组对

402 Payment Required

进行训练,其中正对 来自同一个类别,负对 来自不同的类别。 , 和 分别表示三元组损失函数中的锚点项,正项和负项。

一般来说,来自同一类的图像应该靠近在一起,并在嵌入空间中形成许多分离良好的簇。因此,三元组损失函数的目标是确保一个类的所有样本都将投影到嵌入空间中的单个点上,同时,锚点样本应该远离负样本。三元组损失定义为如下所示:

其中表示正样本对和负样本对的间隙,并且用于测量和在隐特征空间之间的距离。三元组损失将源图像的特征推离源类并将其拉近目标类。

5e8569f392a04efd7b01e078e0afb793.png

论文中提出的可迁移注意力攻击是基于的传统攻击方法扩展而来,该方法通过在计算梯度中累积动量向量,使动量不受局部最优解的影响。又因为优化三元组损失而不是交叉熵损失会破坏潜在的表示空间,所以作者提出了两个版本的TAA算法,更直观的变体如下算法所示。

de9df9107500c916dad8bf7de88547dd.png

STAA:给定一个干净图片,作者通过将输入到层截断的分类器中来生成锚特征。为了使梯度尽可能大,对于,作者找到最远的正特征和最近的负特征,利用三元组对训练损失函数。与MI-FGSM类似,该攻击使用迭代动量项向锚点图像添加对抗扰动。为了使对抗样本的分布与源图像保持一致,攻击在添加对抗扰动后将对抗样本截断到范围内。

 :正如上面STAA算法原理类似,攻击会选择最近的负样本和最远的正样本,以提供有用的梯度;CTAA是将锚点样本移近目标类簇的质心,攻击分别选择源类簇和目标类簇的质心,而不是最近点或最远点,选择层簇的质心计算方法如下:

其中是白盒模型正确分类的图像数,是的真实标签。作者用目标类簇质心和源类簇质心来代替和。与STAA不同,STAA通过根据距离选择样本来最大限度地利用梯度,CTAA旨在引导对抗样本更靠近目标类簇的中心,这更有助于生成可迁移性和稳定性的有目标对抗样本。 

作者采用了一种新的策略,即通过将CNN的低层和高层信息分别结合起来,将两个三元组损失一起优化。通常,低层特征包含相对丰富的细节信息,而高层特征包含丰富的全局语义信息。最终的损失函数如下所示:

其中和表示模型的不同层,这种策略提高了对抗样本的可迁移性。 可迁移性衡量由本地白盒模型生成的对抗样本迁移到黑盒模型的能力。目前评估对抗样本可迁移性的指标有两个:非目标迁移率()和目标迁移率()。

是导致白盒模型和黑盒模型被对抗样本误分类的百分比,而是由白盒模型生成导致黑盒模型预测也误分类到目标类的目标对抗样本的百分比。具体公式如下所示:

402 Payment Required

其中,和是根据对抗样本的置信度排序的集,分别通过误差公式和公式计算得到。表示黑盒神经网络。表示如果满足以下条件,则条件函数为,否则为。

      04      

实验结果

下面三个表格分别是论文中的方法与当前最先进方法的比较结果,其中第一张表格为白盒攻击结果,第二三张表格为黑盒攻击结果。下表格中表示左模型生成的对抗样本输入到右模型中。

如下第一张表格可以发现,动量方法中的和仍然是白盒攻击中的最佳方法,它以几乎的错误率和攻击成功所有网络。又可以发现论文中提出的标准方法的性能要优于,率要高达,并且在所有网络中都实现了的误差,在所有场景中,质心的性能甚至优于标准。

这验证了论文中的方法可以处理在特征空间上复杂的数据集中白盒有目标攻击的低成功率,因为其同时考虑了将对抗样本从源类进行推离并拉近目标类。从第二张表格可以看出,在黑盒攻击中标准和质心在所有指标上都优于其他方法,并且从第三张表格可以发现,质心实现了最高的性能。

b1af6890c619d604618432a6fa099bf6.png

5e24569304c40af3aafb7ef5b8b86bf3.png

如下图所示为定性的结果,给定一个干净的图像,该图像被网络正确分类,通过可以迁移注意力攻击获得相应的对抗样本,左栏是要攻击的干净图像,浅蓝色条是图像的真实标签分布。而右栏是论文方法的结果,可以发现如亮绿色条所示,对抗样本被分类为目标类。

989640739ebf528961090a30e589bd27.png

从下图是进一步论文方法生成的定性可视化结果,选择锚(a)、正(b)和负(c)样本作为三重态对的输入,作者通过可迁移注意攻击获得相应的对抗样本(d)。 

2e56097f884a1a16cb217a22bef234ab.png

如下图所示,具有不同结构的白盒模型和黑盒模型仍然依赖于相似的注意图,这就是为什么对抗样本可以在黑盒模型之间进行迁移。另外,这些注意图在潜在表征空间上受到干扰,以增强对抗样本的可迁移性。

d8d046326e286e45518d23eb206aa710.png

23c8ede0e24e39ed94224dd2bf9c287f.png

END

欢迎加入「对抗学习交流群👇备注:Ad

262249e9424e17f46d4bff87ce739494.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值