1、2017会议论文ICME:An accurate deepconvolutional neural networks model for no-reference image quality assessment,复旦大学。
1.1用了部分残差网络(ResNet)的知识,但是只用了两层残差网络。并且,该网络的输入为32*32的块,其label是用FSIM计算得到的。
---- 其中sum1是指conv2输出的feature map和conv3输出的feature map进行pixel-wise的相加。
1.2参数的设置:input:32*32,没有任何预处理,非重叠取块;损失函数:1范数;Learning rate的初始值为0.01,每过5个epoch,learning rate下降10倍,learning rate等于0.0001时,就固定不变了;80 epoches。在LIVE和TID2008数据库上进行试验,LIVE:PLCC-0.974,SRCC-0.971; TID2008:PLCC:0.957,SRCC:0.939。实验时,并没有将数据库分成train data (80%)和test data(20%), 原因论文中也讲了,作者用FSIM计算每一个image patch的分数,当成是image patch的label。其实,这类方法很多论文都出现过,但是用FSIM计算image patch的label,好像是第一次见到。(这类方法就是opinion-unaware)。!!!!需要注意的是,以为TID2008数据库中包含的失真类型太多,大部分论文都只使用部分data去做train和test(几种常见的失真)。
评论:感觉这种方法是有别于用FR method去计算whole image的label,为什么这样讲?比如FSIM&#x