传统全参考图像质量衡量标准 结构相似度
结构相似度SSIM 是目前最为成功、使用范围最广泛的评价标准,在图像科学的很多领域都是必备的评价指标,如果对于场景的把握不是非常熟悉使用ssim是一个推荐选项
ssim的设计灵感来源于心理学上的韦伯定理,韦伯定理描述的是人体对于感知信号的敏感程度,简而言之就是人体对于信号的变化绝对值并不敏感而对于信号的相对变化值十分敏感,用数学公式表达如下:
C
=
Δ
I
I
C = \frac{\Delta I}{I}
C=IΔI
首先,SSIM的设计者认为图像中的像素是有高度的相关性的,比如一副桌面图像,桌面上的像素点具有高度的相似性而这种相似性可以用来描述桌面这一个物体,另外设计者认为一个物体的结构信息属于物体的本质信息,该本质信息并不取决于图片中光场的分布,因而是可以额外提取出来的。基于以上认识以及前人的工作,认为图像中主要有三个要素:
- 光场照明,这取决于光场本身的强度以及物体与光源的相对位置,是物体本身无法影响的
- 对比强弱,这取决于光场和物体结构的相互作用,放在光学里面理解就是物体表面形态,性质,比如是否是漫反射,表面是否透明等等
- 物体本身的结构特征 ,是光源本身无法影像的
设计者将系统简化为上述的三者,将无法影响的光源到无法影像的物体本身结构构件了一个描述图像的模型
然后对上述三者进行分别解读: 图像光场的分布实际上是可以用相似像素的均值来刻画,因为均值是反映光场普遍的一种强弱信息;对比强弱实际上是可以用相似像素的标准差来刻画,因为标准差是来衡量两者的差异,也就是两者直接对比度的问题;关于物体本身的结构,作者按照上图的系统简化模型来看,认为应该去掉光场的影响,也就是扣除均值,并且需要做方差归一化,也就是除以标准差的过程 。
那么三者可以如下描述:
l
(
x
,
y
)
=
2
(
1
+
R
)
1
+
(
1
+
R
)
2
+
C
1
μ
x
2
l(x , y) = \frac{2(1+R)}{1+(1+R)^2+\frac{C_1}{\mu_x^2}}
l(x,y)=1+(1+R)2+μx2C12(1+R)
c
(
x
,
y
)
=
2
σ
x
σ
y
+
C
2
σ
x
2
+
σ
y
2
+
C
2
c(x , y) = \frac{2\sigma_x\sigma_y+C_2}{\sigma_x^2 + \sigma_y^2 + C_2}
c(x,y)=σx2+σy2+C22σxσy+C2
s
(
x
,
y
)
=
σ
x
y
+
C
3
σ
x
σ
y
+
C
3
s(x , y) = \frac{\sigma_{xy} +C_3}{\sigma_x \sigma_y + C_3}
s(x,y)=σxσy+C3σxy+C3
其次,认为上述三者是一个互相耦合的过程,因而最终描述图像的公式形态应该是三者的相乘的形式,并且按照韦伯定理和闵可夫斯基距离的关系,认为这里实际相乘的应该是三者的指数形式,而当三者的指数都为1时可将上述三者简化为:
S
S
I
M
(
x
,
y
)
=
(
2
μ
x
μ
y
+
C
1
)
(
2
σ
x
y
+
C
2
)
(
μ
x
2
+
μ
y
2
+
C
1
)
(
σ
x
2
+
σ
y
2
+
C
2
)
)
SSIM(x,y) = \frac{(2\mu_x\mu_y +C_1)(2\sigma_{xy} +C2)}{(\mu_x^2 + \mu_y^2 + C_1)(\sigma_x^2 + \sigma_y^2 +C_2))}
SSIM(x,y)=(μx2+μy2+C1)(σx2+σy2+C2))(2μxμy+C1)(2σxy+C2)
这就是ssim公式的常用表现形式,这里
μ
x
与
μ
y
\mu_x 与\mu_y
μx与μy分别是两幅图中均值
σ
x
\sigma_x
σx和
σ
y
\sigma_y
σy如下所示:
σ
x
=
(
1
N
+
1
∑
i
=
1
N
(
x
i
−
μ
x
)
2
)
\sigma_x =\sqrt{ (\frac{1}{N+1}\sum_{i=1}^{N}(x_i - \mu_x)^2)}
σx=(N+11i=1∑N(xi−μx)2)
需要注意的是
σ
x
y
\sigma_{xy}
σxy的表达式
σ
x
y
=
1
N
+
1
∑
i
=
1
N
(
x
i
−
μ
x
)
(
y
i
−
μ
y
)
\sigma_{xy} = \frac{1}{N+1}\sum_{i=1}^{N}(x_i -\mu_x)(y_i-\mu_y)
σxy=N+11i=1∑N(xi−μx)(yi−μy)
这里其实一直有一个问题我目前没有搞清楚,那就是为什么
2
x
y
x
2
+
Y
2
\frac{2xy}{x^2+Y^2}
x2+Y22xy这种结构同韦伯定理如何联系上的。因为我看见很多其他的评价指标都有类似的结构,因此这里需要搞清楚