这是2018CVPR的一篇论文(原论文地址:https://arxiv.org/abs/1711.06077),论文主要说明感知质量和图像失真程度并不是完全对应的。基于深度网络的特征失真可能更好的表示图像感知质量的好坏,而使用GAN网络可以获得具有较好感知质量效果的图像。失真-感知之间存在一个可以实现的区域,在这个可以实现的区域里失真程度和感知质量并不是完全的相关,也就是失真较大时感知质量也可能比较好,论文给出的图如下所示:
![](https://i-blog.csdnimg.cn/blog_migrate/648c2810a658edd2b4be61053dd2464c.png)
失真和感知质量
失真用来衡量给定图像和参考图像之间的差异程度。最常见的失真是MSE,但是与图像之间的语义相似性比较差。其他衡量失真的标准包括SSIM、MS-SSIM等,最近基于神经网络的距离误差可以捕获更多的语义信息,从而获得高质量的重建。
感知质量是使图像看起来和自然图像更像而不考虑其与参考图像之间的相似性。目前主要的评价方法包括基于人类评价的质量评估方法,无参评价方法(如KL散度)和基于GAN网络的评价方法,这些方法基本都是利用统计学的知识进行评价。
建立问题的公式
实际上自然图像可以看做是自然图像pX的自然分布的一个实现,可以把失真后的图像y看成是给定原图像x在条件分布pY|X下产生的结果,失真后还原的图像x’可以看成y在条件分布pX|Y产生的结果。失真的公式可以表示如下:
E(△(X,X′))(1) E ( △ ( X , X ′ ) ) ( 1 )
感知质量指标的表达式如下(值越低越好):
d(pX,pX′