出处
2020 ECCV
现有方法的不足
1.尽管基于UNet的微光图像增强方法显示出了令人振奋的结果,但由于缺乏全局颜色信息,UNet生成的图像具有诸如颜色不一致等伪影。
2.目前大多图像去噪和增强方法分开进行,耗费大量的时间和计算资源。
本文贡献
1.本文提出了一种全局信息感知(GIA)模块,该模块能够提取全局信息并将其集成到UNet中,以提高微光图像增强的性能。
2.提出结合全局信息,一次性完成微光图像增强工作。
全局信息感知(GIA)模块
该模块通过结合输入信息和由下采样过程提取的全局信息,从而达到全局信息感知的效果。示意图如下:
首先对输入的
X
X
X进行下采样操作
f
1
(
⋅
)
f_1(\cdot)
f1(⋅)以提取全局信息,再进行上采样操作
f
2
(
⋅
)
f_2(\cdot)
f2(⋅)恢复输入尺寸,由对流层处理(缩小通道)后与
X
X
X组合,最后再进行对流层处理得到含全局与局部信息的特征图像。
网络架构
如图所示,将GIA模块添加到UNet编码与解码部分之间。首先输入图像经过一些列下采样阶段提取抽象特征,同时降低空间分辨率,GIA模块负责提取全局信息,与输入特征图相结合,再经历一系列上采样过程得到结果。
损失函数
像素级约束
用
L
1
L_1
L1损失去计算真实图像与增强后图像每个像素间的差异。具体公式如下:
L
L
1
=
1
N
∑
p
=
1
N
(
I
p
,
I
^
p
)
(1)
L_{L_1}=\frac{1}{N}\sum_{p=1}^N(I_p,\hat I_p)\tag{1}
LL1=N1p=1∑N(Ip,I^p)(1)
其中
p
p
p表示像素的位置,
N
N
N表示像素总数。
多尺度结构相似性损失MS-SSIM
MS-SSIM是SSIM在多尺度域上的扩展,其定义如下:
M
S
−
S
S
I
M
=
l
M
α
(
i
)
⋅
∏
j
=
1
M
c
s
j
β
j
(
i
)
(2)
MS-SSIM=l_M^{\alpha}(i)\cdot\prod_{j=1}^Mcs_j^{\beta_j}(i)\tag{2}
MS−SSIM=lMα(i)⋅j=1∏Mcsjβj(i)(2)
其中
l
(
i
)
l(i)
l(i)和
c
s
(
i
)
cs(i)
cs(i)分别是像素
i
i
i处的对比度和结构差项的亮度和乘积,其定义如下:
l
(
i
)
=
2
μ
x
μ
y
+
C
o
n
s
t
1
μ
x
2
+
μ
y
2
+
C
o
n
s
t
1
(3)
l(i)=\frac{2\mu_x\mu_y+Const_1}{\mu_x^2+\mu_y^2+Const_1}\tag{3}
l(i)=μx2+μy2+Const12μxμy+Const1(3)
c
s
(
i
)
=
2
σ
x
y
+
C
o
n
s
t
2
σ
x
2
+
σ
y
2
+
C
o
n
s
t
2
(4)
cs(i)=\frac{2\sigma_{xy}+Const_2}{\sigma_x^2+\sigma_y^2+Const_2}\tag{4}
cs(i)=σx2+σy2+Const22σxy+Const2(4)
其中
(
x
,
y
)
(x,y)
(x,y)表示像素
i
i
i的坐标,
μ
x
,
μ
y
,
σ
x
,
σ
y
,
σ
x
y
\mu_x,\mu_y,\sigma_x,\sigma_y,\sigma_{xy}
μx,μy,σx,σy,σxy分别是
x
x
x和
y
y
y的均值,标准差,以及协方差。
M
M
M是执行SSIM的级数,
j
=
1
,
2
,
.
.
.
M
j=1,2,...M
j=1,2,...M。
α
\alpha
α和
β
j
\beta_j
βj的值设置为1。
C
o
n
s
t
1
Const_1
Const1和
C
o
n
s
t
2
Const_2
Const2是较小的常量。
MS-SSIM是介于0和1之间的标量,越大越好。因此,用于优化网络的最终损失函数为:
L
M
S
–
S
S
I
M
=
1
−
M
S
–
S
S
I
M
(5)
L_{MS\text{--}SSIM}=1-MS\text{--}SSIM\tag{5}
LMS–SSIM=1−MS–SSIM(5)
总的损失函数
L = γ L L 1 ( I , I ^ ) + ( 1 − γ ) L M S – S S I M ( I , I ^ ) (6) L=\gamma L_{L_1}(I,\hat I)+(1-\gamma )L_{MS\text{--}SSIM}(I,\hat I)\tag{6} L=γLL1(I,I^)+(1−γ)LMS–SSIM(I,I^)(6)