【论文精读】Low-Light Image Enhancement via a Deep Hybrid Network

最新推荐文章于 2024-10-08 19:26:48 发布

孤单中颤抖

最新推荐文章于 2024-10-08 19:26:48 发布

阅读量1.2k

点赞数 2

分类专栏：论文精读文章标签：深度学习 pytorch 神经网络机器学习

本文链接：https://blog.csdn.net/weixin_42780429/article/details/114830594

版权

论文精读专栏收录该内容

12 篇文章 3 订阅

订阅专栏

论文出处

IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 28, NO. 9, SEPTEMBER 2019

摘要

1、提出了一种混合神经网络，由两个不同的流组成：
1）内容流：通过编解码器网络估计微光输入图像的全局内容，但是该部分会损失输入图像中的细节内容；
2）边缘流：提出了一种新的空间可变递归神经网络，在另一个自动编码器的指导下对边缘细节进行建模。
因此，网络可以同时学习微光图像的全局内容和显著性结构。
2、利用感知损失和对抗性损失对网络进行训练，产生令人愉悦的增强图像。
3、该网络仅仅是从原问题出发——微光图像增强，并未对其它论文中出现的问题进行讨论。

网络结构

在这里插入图片描述
该模型由两个流组成，上面的内容流是残差编解码器，旨在恢复大部分场景。下面的边缘流通过空间变化的RNN进行显著边缘预测。为了在两个流之间构建通信，在上采样阶段桥接两个网络。除了MSE损失外，我们还采用了感知损失和对抗性损失来进一步提高视觉质量。

A.内容流

构建了基于残差编解码器体系结构的内容分支，具体的内容预测设计如下：
1)将编码器中的前两卷积层改为空洞卷积，以扩大接收范围；
2)将边缘流中的解卷积模块的特征连接起来。
残差编解码器网络有三个卷积模块，每个模块由多个卷积层、ReLU层和skip link组成。具体地说，来自第一、第二和第三卷积的特征分别具有输入图像大小的1/2、1/4、1/8的大小。相应的解码器引入了上采样操作来放大特征映射。

B.边缘流

引用了具有空间可变的RNN的边缘流，以学习输入图像和相应地图的权重映射。具体是利用输入图像在 $k$ 位置上的像素 $x [k]$ ，将先前的隐藏状态 $h [k - 1]$ 转移到当前状态 $h [k]$ 。一维中的空间递归关系可以由下式建模：
$h[k]=(1-p[k])\circ x[k]+p[k]\circ h[k-1]\tag{1}$
其中 $p [k]$ 是平衡 $x [k]$ 和 $h [k]$ 之间的加权因子。
CNN依赖于图像内容来学习相应的权重图 $p$ ，公式（1）是在某一指定频率具有单位增益的归一化滤波器。
但该方法不能直接应用于微光图像增强任务，当直接使用标准化的RNN时，若输入微光图像，则输出仍是微光图像。如下图所示：
在这里插入图片描述
由于空间上的RNN等价于归一化滤光器，因此RNN的输出在给定弱光输入 $(a)$ 的情况下仍然是微光图像 $(b)$ 。相反，我们改进的空间可变RNN学习显著的边缘相关特征，如 $(c)$ 所示。
根据以上内容，提出了一种边缘流来弥补微光图像的结构信息丢失，改进的空间变异RNN模型：
$h[k]=g[k]\circ x[k]+p[k]\circ h[k-1]\tag{2}$
不同于等式（1），引入了一种新的于 $p$ 无关的权重图 $g$ ，使得当前图像像素信息 $x [k]$ 和先前的隐藏状态 $h [k - 1]$ 可以更灵活地融合。
在这里插入图片描述
上图所示，输入信息由微光图像及其对应的梯度组成。CNN依赖于输入信息生成权重图 $g$ 和 $p$ 。多尺度特征 $x$ 进一步由输入图像组成。一个方向空间变化的RNN，特别是从左到右(图中的红色箭头)，采用所生成的权重图 $g$ 和 $p$ 以及多尺度特征 $x$ 来递归地生成隐藏状态，即边缘特征。请注意，对于每个特定方向，输入图像被视为一组一维序列。
在本文中，我们还采用了带有跳跃连接的编解码器结构来计算像素方向的权重 $g [k]$ 和 $p [k]$ 。我们发现该网络与内容分支具有相似的属性，并且它们的特征表示具有相似的比例，这使得能够合理地连接到内容流。此外，为了生成输入图像的多尺度特征 $x$ ，我们使用{1/2，1/4，1/8}的比率，然后将它们的大小调整到原始大小，并将它们与原始图像连接在一起。因此，我们的空间变异RNN中的 $x [k]$ 可以通过粗尺度的处理达到更全局的范围。利用多尺度特征 $x$ 以及学习到的权重图 $g$ 和 $p$ ，我们的RNN依赖于公式（2）从四个不同的方向扫描图像。因此，生成四个隐含激活图来学习不同的边缘相关特征。我们根据每个位置的最大响应来选择最优方向，从而整合了这些特征。这是通过逐节点的最大汇集来实现的，其有效地选择响应最大的方向作为要传播的期望的显著边缘信息。
混合网络学习到内容和边缘相关特征后，将这些特征融合在一起，再加上两个额外的卷积层。