这段时间一直在用卷积神经网络做图像质量评价的事情,但是效果一直不好,后面找到了这篇文章进行阅读,记录一下阅读重点,希望有所启发。
摘要
本文中的摘要部分主要介绍了本文的主体,第一点是将图像切成小块放入网络进行训练(这是输入数据的特征),第二点提到了本文用到了最大池化和最小池化(一般都是最大池化,第一次见最小池化,后面弄懂作用)
Introduction
这项工作和之前用CNN进行分类的工作有差异,CNN并不为了对图像质量特征设计的。在图像识别领域好的特征一般是把局部不变信息进行编码,在图像质量任务中,好的特征应该可以是可以捕捉到NSS(自然场景统计)属性。本文修改了CNN的框架,使得CNN框架能够更好的学习和估计图像质量。这里涉及到了自然场景统计特性(这是什么呢?)
自然场景统计特性
自然图像和人工图像有很大差别。计算机生成的人工图像其数据毫无规律,而自然图像是对客观世界的真实反映,包含一定规律:自相似性、尺度不变性、非高斯性、边缘主导性
relate work
之前的很对方法都需要预处理,而本文中的CNN则不会需要预处理得出的一些特征,而是让CNN自己学习特征。首先我们要先对原始图像进行对比度归一化,紧接着把每一小块放入CNN进行训练,取一张图片分成小块的平均值作为最终图片得分。
结构
对比度归一化
在深度学习中,对比度通常指的是图像或图像区域中像素的标准差。对比度归一化包括全局对比度归一化和局部对比度归一化,是深度学习中常用的一种数据预处理方法,用以减少数据中的变化量从而减少泛化误差和拟合训练集所需模型的大小。
本文使用了局部对比度归一化
池化
本文用了最大池化和最小池化,关于最大池化和之前的神经网络作用一样,最小池化的作用顾名思义,也就是将每个特征图中最小的特征取出来,但是这一步是为什么呢?至今没想明白。。。。(后面想明白了会更新)损失函数不再用relu函数,因为如果最小池化提取出来是负值(极有可能是负值),relu函数会把它抹去为0,所以改成了线性函数。