点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
随着像Facebook和Instagram这样的社交网络服务的出现,在过去十年中产生的图像数据量有一个巨大增加。使用图像(和视频)等处理软件GNU Gimp,Adobe Photoshop创建修改过的图像和视频是Facebook等互联网公司的主要关注点。
这些图片是假新闻的主要来源,经常被用于恶意的方式,如煽动暴徒。在对可疑图像采取行动之前,我们必须核实其真实性。IEEE信息取证和安全技术委员会(IFS-TC)发起了一项检测和定位取证挑战第一次图像取证挑战2013年解决了这个问题。他们提供了一个开放的数字图像数据集,其中包括在不同光照条件下拍摄的图像,以及使用如下算法生成的伪造图像:
内容感知的填充和补丁匹配(用于复制/粘贴)
内容感知修复(用于复制/粘贴和拼接)
克隆图章(复制/粘贴)
缝刻(图像重定向)
修复(受损部分的图像重建-复制/粘贴的特殊情况)
Alpha Matting(用于拼接)
挑战的两个阶段
第一阶段要求参与的团队将图像分类为伪造的或原始的(从不操纵)。
第二阶段则要求他们检测/定位伪造图像中的伪造区域。
为什么使用CNN ?
在人工智能的前深度学习时代,图像处理研究人员用于设计手工特征,解决一般的图像处理问题,特别是图像分类问题。一个这样的例子是Sobel内核用于边缘检测。之前使用的图像取证工具可以分为5类,即
基于像素的技术,检测像素级引入的统计异常。
利用特定有损压缩方案引入的统计相关性的基于格式的技术。
利用相机镜头、传感器或芯片后处理引入的伪影的基于相机的技术。
基于物理学的技术,明确地建模和检测物理对象、光和相机之间的三维交互作用中的异常。
基于几何的技术,使世界上的对象和他们的位置相对于相机的测量。
几乎所有这些技术都利用了图像的基于内容的特征,即图像中呈现的视觉信息。CNN的是灵感来自视觉皮层。从技术上讲,这些网络被设计用来提取对分类有意义的特征,即那些使损失函数最小化的特征。通过梯度下降法学习网络参数-核权值,从而从输入给网络的图像中生成最有区别的特征。然后,这些特征被提供给一个完全连接的层,该层执行最后的分类任务。
在观察了一些伪造的图像后,很明显,人类视觉皮层找到伪造的区域是可能的。因此CNN是这个工作的完美的深度学习模型。如果人类的视觉皮层能够探测到它,那么这个专为这项任务而设计的网络肯定会更强大。
数据集
在进入数据集概述之前,需要明确使用的术语