【论文笔记】Learning Rich Features for Image Manipulation Detection（CVPR2018）

原创

已于 2022-10-24 13:45:35 修改 · 3.8k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2022-10-12 15:04:31 首次发布

CVPR2018: Learning Rich Features for Image Manipulation Detection
原文链接：http://arxiv.org/abs/1805.04953
一作开源源码：https://github.com/pengzhou1108

方法的提出

目前篡改手段越来越多，也越来越高级，有些在对图片进行了篡改之后会对图片进行高斯平滑、压缩等后处理，导致很难识别出被篡改的区域
目前存在的一些检测技术也存在一些局限性，例如LSTM体系结构、局部噪声特征+CFA模式，这些方法大多集中于特定的篡改伪影，并仅限于特定的篡改技术
图像篡改检测不同于传统的语义对象检测，因为它更加关注篡改伪影而不是图像内容，这表明需要学习更丰富的特征。本文提出了一种双流的Faster R-CNN网络，来学习丰富的图像篡改检测特征。实验表明，该网络对拼接、复制移动和删除具有鲁棒性。此外，该网络使我们能够对可疑的篡改技术进行分类
本文还使用SRM滤波器内核来提取低级噪声，用作Faster R-CNN网络的输入，并学习从噪声特征中捕获篡改痕迹。此外，还联合训练一个并行的RGB流来建模中级和高级的视觉篡改伪影

在四个标准图像处理数据集上的实验表明本文的双流框架优于每个单独的流，并且与其他方法相比，在压缩图像和改变大小的图像的检测上表现出了该方法的鲁棒性，达到了最先进的性能。

一种目标检测算法。

上图为Faster R-CNN的基本结构，由四个部分组成：

卷积层（Conv layers）。用于提取图片的特征。输入为整张图片，输出为提取出的特征feature maps。由一组基础的conv+relu+pooling层组成。该feature maps被共享用于后续RPN层和全连接层。
RPN网络（Region Proposal Networks）。RPN网络用于生成候选区域