1、Deep Convolutional Neural Models for Picture-Quality Prediction
一篇17年的survey,just so so……,有张图很具有代表性。
4种方式,浅显易懂。problems:数据太少,不足。1 images = local。2,用FR等生成local scores。
还有一张,几个结果对比。
主要提了LIVE Challenge数据集,预训练的Alex和res具有对真实图像的识别能力,所以在该数据集上表现最好,而对于合成的数据集反而需要很大的训练才行。 这是共识了吧,,我也不知道,反正我同意,但是在LIVE Challenge数据集上,普遍表现都不好吧。所以在real world中还有很大的提升空间。
2、Blind Image Quality Assessment Using A Deep Bilinear Convolutional Neural Network
这篇的出发点就是基于合成失真和真实失真不同。对两种情况做了两个网络,然后用bilinear pooling 结合。
1) synthetic distortions(S-CNN)
用PASCAL VOC 2012 数据集训练,输出39维的one-hot向量,39=7*5+2*2,采用的是分类的方式。
2)authentic distortions(VGG16)
用的是在ImageNet上预训练过的vgg16
3)bilinear pooling
emmmmm,一到公式本人就开始稀里糊涂。可能是这个双线性模式的基本公式吧,,不想贴了。
有一句话没看明白。It is worth noting that bilinear pooling is a global strategy and therefore DB-CNN accepts an input image of arbitrary size.因为双线性是全局模式所以可以使任意输入大小,那S-CNN的fc也过不去啊????
这个结果,在LIVE Challenge上确实可以。
Ps:怎么把论文附在后面啊,,,,