©PaperWeekly 原创 · 作者 | 鬼谷子
引言
该论文是关于黑盒对抗攻击的工作。论文中作者提出了一种基于积分梯度的可迁移性攻击算法(TAIG),该算法可以生成高可迁移性的对抗样本。作者将三种方法分别是优化标准目标函数、注意力图和平滑决策面集成到论文方法 TAIG 中,作者研究了两种计算直线路径和随机分段线性路径上积分梯度的 TAIG。实验结果表明,论文中提出的方法生成了高迁移性的对抗样本,并且可以与以前的方法进行无缝协同工作,而且 TAIG 的性能优于现有的方法。论文代码目前已经开源了。
论文标题:
Transferable Adversarial Attack based on Integrated Gradients
论文链接:
https://arxiv.org/abs/2205.13152
代码链接:
https://github.com/yihuang2016/TAIG
预备知识
令 是一个分类器网络,该网络将输入 映射成输出向量,其中输出向量的第 个元素表示的是 logit 层第 个输出单元; 表示的是网路将输入 映射成第 类的输出值,即 ,其中 表示的是转置操作。
和 分别表示干净样本和对抗样本,其中 和 分别表示的是干净样本和对抗样本的第 个像素。 是输入 的类别。
积分梯度是一种将深度神经网络的预测归因于其输入特征的方法,其计算的属性表示每个像素对网络输出的重要性,也可以看作是注意值和显著值。积分梯度主要基于两个公理发展而来,即灵敏度和实现不变性,并且满足另外两个公理,即线性性和完备性。积分梯度是从参考图像 到输入图像 的梯度的线性积分。输入 的第 个像素的积分梯度定义为:
其中 表示的是 的第 个像素,且 一般会选取黑色图像。完备性公理表示 和 之间的距离等于 之和: