东北师范大学提出新的基于分层输入梯度网络的深度学习去噪方法

关注公众号,发现CV技术之美

在图像处理中,图像的高频区域(边缘、纹理等)直接影响着结果的视觉感官质量。本文工作重新思考了图像梯度在深度学习网络中的构建,从像素级对噪声图像进行分层,为网络输入提供更多的结构信息,并通过反向传播梯度引导网络学习高频特征。最后提出了即插即用的锐化损失解决去噪图像过于平滑的问题,突出图像中的高频信息而不影响低频信息。在模拟噪声和真实噪声数据benchmark数据集上实现了SOTA。

本文亮点主要包括:

  1. 提出一种基于双U-Net的分层输入梯度网络(LIGN)。在基准数据集上的实验表明,该网络在PSNR和SSIM指标上表现出优异的性能。

  2. 提出了一种新的分层输入法,充分利用了输入图像的内部结构和频率信息。

  3. 将图像梯度深度融合到网络中,从而使网络收敛速度更快,并获得更多高频特征关注。

本文工作『Layered Input GradiNet for Image Denoising』发表于Knowledge-Based Systems (KBS),2022,254:109587。中科院1区、Top期刊。

80e198173fd21b29d0de7370f7078e3a.jpeg

  • 论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0950705122008000

  • 代码:https://github.com/JerryYann/LIGN

  • 单位:东北师范大学

  • 作者:乔双,杨家瑞,张天,赵辰一*

      01      

研究背景

数字图像广泛应用于日常生活中。受多因素影响,如硬件条件、环境变量等,成像系统所成的图像都不可避免存在一定程度的质量退化,其中常见退化现象之一为噪声。噪声的存在对人眼感官,图像结构分析、医学诊断、科学研究等影响较大。因此,图像去噪作为计算机视觉领域的研究热点之一,一直受到科研人员的广泛关注。

本文研究方向围绕具体应用而展开。提出分层输入梯度网络(LIGN),从网络输入端到网络深层结构,以及网络的损失层均提出创新性结构。深度挖掘图像的结构信息,探讨图像不同频率特征的作用,以及通过锐化损失大幅度提高图像的视觉质量。分别在模拟噪声数据集和真实噪声数据集上,在PSNR和SSIM指标实现了SOTA。

      02      

方法

b80c7050fd1490a29829ec0b7aa050eb.png

图1 整体网络框架

分层输入梯度网络的整体框架如图1所示。该网络由以下几个重要部件组成:分层输入,多尺度特征提取块,信息分流块,梯度网络和主网络。对于任意噪声图像0b237e43c52f2f69f82cedf1edc3d773.png(灰度图像或彩色图像,尺寸为7823db5044be06a09069d8ebcf55dfd6.png,网络的输入端将输入图像进行分层,得到一组并行且尺寸为ef2d76145a9145d8530f60b7c9aa19a7.png的输入l。该输入被传入到多尺度特征提取块。多尺度特征提取块从分层输入中提取初始特征787af5dce88932d7456ef9e5c44f71e9.png(尺寸为ec1cb1f53474694f7d797e3491c35b78.png)的特征图:

4ccf0e33d1212883df33e28dcf935c19.png                                     (2-1)

其中,d643057d740e7cddc1a965ee57128cf8.png为多尺度特征提取函数。该特征图由信息分流块分流给梯度网络和主网络(尺寸均为da2e9cd8d4007e1fff57644e91ecffd5.png),表示为

f260d423e4883f34acd5bdacb1478a90.png                                    (2-2)

其中,7b49a8a5c45384c568eee952e22d6c2e.png696eca43f3c8e023b03dcde1aaa0ad1c.png分别用于提取梯度网络和主网络的分流特征dfd210b13a333b9756dbb8c7bd223f10.png3340b9d7f777ce5e1e36594988ce1618.png。梯度网络尽可能地从噪声输入图像中复原其清晰图像的梯度,并提供给主网络。为了让主网络更好地融合梯度信息,提取的梯度经过正则化处理,表示为

e61db78b286d55c4c1623c5b6876a3ee.png                            (2-3)

其中,e294c9a970c63e132cbf6fac66a375c5.png表示扩大因子,c366a3a2d12c46a2180a6ea19b4d43bb.png表示偏置项。667532e922eed7064360956e8aff1335.png为梯度网络提取的梯度信息(尺寸为f56f4f75eb79f827b6a6a4bac6e54cdf.png)。最后将97fbfa3991077f36d1e440fd69f17a99.png2593ee6ece34985bc2ab20ca5d71a2b7.png传入主网络获得残差图像。这里使用一个长跳跃连接将噪声图像与网络的输出764fc993a099f44fb1f8bab9bf6afde9.png连接,表示为

2f8a4617926e3ce68897e5f61cb4ef77.png

其中,f0ca569f1a23423760db98a7f78f57fb.png表示主网络。727c0786f7820d3e99482a8a4dc0d228.png为灰度图像的分层输入的第一层,彩色图像的前三层。

2.1 分层输入

图像中具有相同或相似纹理/边缘特征的像素通常在一定的像素值范围内,这将引导我们对输入图像进行分层,以获得分层的结构特征。网络的输入是噪声图像,噪声会毁坏图像的纹理或结构。那么在噪声图像上的分层是否有用?

如图2,可以看到,分层输入中的清晰图像子图与噪声子图在某一层具有相似的结构纹理,但连续的像素值变为离散。此外噪声的随机性将其他层结构映射到噪声子图的某一层,同时无特征层的噪点对于去噪网络是非常容易去除的。分层输入为网络提供了额外的结构信息,有助于网络对图像特征的复原。

844063966671ceeb579c619259ea85d0.png

图2 分层输入分析。最左和最右两幅图像分别为清晰图像和噪声图像,中间两幅图像分别为对应的清晰子图像和噪声子图像。从上到下分别是第三层、第七层和第八层。

2.2. 多尺度特征提取块和信息分流块

相对于单一的特征提取模块,多尺度特征提取块可以挖掘不同感受野大小的特征。网络浅层包含更加细腻的特征成分,宽的网络结构被证明可以提高网络性能。多尺度特征提取块的设计具有网络层浅和网络结构宽的优势。信息分流块的作用是将特征提取块提取的并行特征分离给两个网络。

2.3. GradiNet&MainNet

梯度网络(GradiNet)从噪声图中学习清晰图像的梯度,归一化后传给去噪网络(MainNet)。两个网络的结构如图3所示,均为类似U-Net结构。GradiNet完全学习图像的高频成分,即图像的纹理边缘特征等。同时,我们设置了机制阻止MainNet的反向传播梯度流向GradiNet(如图2中绿色箭头所示)。GradiNet在学习图像高频成分的同时,其反向传播梯度引导特征提取块关注高频成分。梯度网络的损失函数如下:

55dea848d3c893b8c9f7880864521c62.png

其中,5f66a7c29c0c856a2cb850eb0b79696d.png为拉普拉斯算子,63b928d75536848380be4ea181456459.png为GradiNet提取的梯度。MainNet采用2范数损失函数。

e1e376fe21d6f6d42f2abe6feb467b98.png

图3 主网络的结构

      03      

实验

本文选择了性能最先进的模拟噪声和真实噪声去除算法进行对比测试。实验结果如图4和表1数据所示,在模拟噪声数据集(BSD68,Kodak24等)上,尤其在高噪声强度下,实现了SOTA。同时在真实噪声数据集DND上略强于SOTA方法NBNet。

最后,对加入了锐化损失结构的网络结构进行性能测试,结果见图5。左边为LIGN的去噪结果,右边为加了锐化损失结构的去噪结果。可以看出加入锐化损失结构后图像的细节被增强。此外,锐化损失采用即插即用形式,可以按照实际应用选择使用。

2789003f7bf0f73dc52726223ac011f3.png

图4 真实图像的去噪可视化

表1真实图像的去噪性能对比

3c463ef0a3840cb6ff60e36f8d86c4ec.png

a701639144df4942178bb9bfd37df205.png

图5 锐化损失的结果

      04      

总结

本文提出了基于梯度分层的图像去噪网络,可视化结果表明,锐化损失的结果具有更清晰的纹理,突出的边缘和舒适的视觉效果。我们相信,基于梯度的去噪网络将在未来得到进一步的应用和探索。

0f15c8549d354fcbc355aebb9092aaa4.jpeg

END

欢迎加入「图像去噪交流群👇备注:去噪

43ad1f4567939378d492d912b33d9bef.png

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值