Seeing is Not Believing: Camouflage Attacks on Image Scaling Algorithms论文学习笔记

本文链接：https://blog.csdn.net/canlander/article/details/136736712

以下内容源自论文

Abstract and Introduction：

图像缩放算法要求——保持缩放前后的视觉特征

论文对于常见缩放算法自动生成伪装图像进行攻击

攻击算法效果——视觉语义在缩放后发生巨大变化

大多数深度学习模型需求固定大小的输入层数据。因此，输入图像必须在数据预处理过程中进行缩放以满足

特定模型输入要求。

论文中的攻击者可以利用当大图像调整为较小的图像时发生的“数据欠采样”现象，导致同一图像的人和机器之间的“视觉认知矛盾”，从而实现检测规避和数据中毒等恶意目标。攻击发生在模型预训练阶段，在数据输入之前就已生效，也就是与学习模型无关。

（数据欠采样：欠采样是一种在数据不平衡的情况下，通过减少多数类样本数量来提高少数类样本分类性能的方法。即精进减少原有样本数量。

视觉认知矛盾：人和机器识别结果不同，首先在图像上欺骗人，然后在图像特征上使机器被蒙蔽。）

攻击者需要处理的两种技术挑战：

（a）首先，攻击者需要通过分析缩放算法来决定在哪里插入具有欺骗效果的像素。人工不可行。需要探索一种自动高效的伪装图像生成方法。

(b) 其次，对于基于云的计算视觉服务（现实场景），其模型的确切缩放算法和输入大小是不可见的。攻击者需要想办法先获取算法的相关参数才能使攻击成功。

白盒情况：

论文分析了三个流行的深度学习框架中常见的缩放实现：Caffe、TensorFlow 和 Torch。确认这些框架使用的几乎所有默认数据缩放算法都容易受到缩放攻击。

黑盒情况：

论文研究了针对基于云的计算机视觉服务的缩放攻击。结果表明有可能将缩放攻击发起到大多数现有的基于云的计算机视觉服务。图像缩放实现的可能方法相对有限，可以进行暴力猜测。文章展示了一种较之暴力破解简单而有效的测试方法，在 Microsoft Azure1、百度 2、阿里云 3 和腾讯 4 上成功进行了攻击。

有趣的是，我们还发现并讨论了攻击影响的范围扩展到一些计算机图形应用程序，例如主流 Web 浏览器。

视频演示攻击效果：https://youtu.be/Vm2N0mb14Ow

贡献概括：

1.揭示了计算机视觉应用中图像缩放过程的安全风险。验证和测试了流行的深度学习(DL)框架中常用的图像缩放算法，结果表明安全风险几乎影响所有基于DL框架的图像应用。

2.将缩放攻击形式化为一个预先训练好的优化问题，并提出了相应的实现来自动生成伪装图像。

3.证明了所提出的攻击对于云视觉服务仍然有效，其中图像缩放算法和参数的实现细节来自用户，即黑盒场景

4.提出了几种潜在的防御策略。

Image Scaling Attack Concept and AttackExamples：

图像缩放算法旨在保持图像的视觉特征，同时调整其大小。攻击者可以使用缩放算法通过仔细调整像素级信息来改变图像的语义。

常见的图像缩放算法：最邻近，双线性，三线性

攻击示例：

1.本地图像分类应用程序 cppclassification [16] 的第一个攻击示例。对于输入大小为224*224的分类模型，专门制作不同大小的输入图像(672*224)。虽然图2左栏的输入在视觉上呈现出类似羊的图，但深度学习模型将右栏中的图像作为实际输入，并将其分类为“White Wolf”的一个实例。

2.针对百度图像分类服务的攻击示例。攻击图像是从哔哩哔哩图像制作的，目的是让人们将其视为喘息，但机器将其视为狼。结果云服务 API 5 返回表明攻击图像被分类为具有高置信度分数的“Grey Wolf”（达到 0.98829），表明攻击是有效的。

数据缩放实际上是深度学习应用中的常见动作。深度学习神经网络模型通常需要固定的输入尺度。大多数深度学习框架提供数据缩放函数。