DRCN神经网络

uodgnez

已于 2022-02-16 12:36:23 修改

阅读量4.1k

点赞数 2

分类专栏：图像处理文章标签：神经网络深度学习计算机视觉

于 2022-02-15 16:45:45 首次发布

本文链接：https://blog.csdn.net/weixin_48320163/article/details/122945927

版权

图像处理专栏收录该内容

18 篇文章 6 订阅

订阅专栏

1 DRCN

DRCN（Deeply-Recurisive Convolutional Network)，一种利用深度递归卷积网络。DRCN与之前的VDSR都是来自首尔国立大学计算机视觉实验室的工作。该网络将插值后的图像作为输入，并像SRCNN中一样预测目标图像。
在这里插入图片描述
该网络分为三个部分，第一个是Embedding network（嵌入网络），相当于SRCNN中的特征提取；第二个是Inference network（推理网络），相当于特征的非线性映射，第三个Reconstruction network（重构网络），从特征图像恢复最后的重建结果，即重建。

Embedding net：获取输入图像并将其表示为一组特征图。
Inference net：是解决超分辨率任务的主要组件；由单个递归层完成大图像的分析；每个递归都应用相同的卷积。
Reconstruction net：对于大于 $\times 1$ 的卷积滤波器，每次递归后都会扩大感受野。虽然来自递归层最终应用的特征图表示高分辨率图像，但还是需要由重建网络将它们（多通道）转变为（单通道或三通道）。

其中，递归层存在于推理网络中，如图：
在这里插入图片描述
左为递归层，右边为其展开结构。
网络的最终模型具有递归监督和跳过连接。除了推理网络的层是递归的，其他网络与具有单个隐藏层的MLP非常相似。
作者在文章中使用的是 $3\times3\times F \times F$ 的过滤器。
在这里插入图片描述
$H_1$ 到 $H_D$ 是 $D$ 个共享参数的卷积层。将这 $D$ 个卷积层的每一层的结果都通过相同的Reconstruction Net ，在Reconstruction Net 中与输入的图像相加，得到 $D$ 个输出重建结果。这些所有的结果在训练时都同时被监督，即所有的递归都被监督，作者称之为递归监督，避免了梯度消失/爆炸问题。将 $D$ 个递归得到的结果再加权平均：
$\hat{y} = \sum_{d=1}^{D} w_d \cdot \hat{y_d}$
其中 $w_d$ 表示在递归期间从每个中间隐藏状态重建的预测的权重；并在训练期间习得。
最终的目标函数需要优化两个部分的误差：
$l_1(\theta)=\sum_{d=1}^D\sum_{i=1}^{N}\frac{1}{2DN}\lVert y^{(i)}-\hat{y_{d}}^{(i)}\rVert^2$

$l_2(\theta)=\sum_{i=1}^N \frac{1}{2N} \lVert y^{(i)}-\sum_{d=1}^D w_d \cdot \hat{y}^{(i)}\rVert^2$

损失函数：
$L(\theta)=\alpha l_1(\theta)+(1-\alpha)l_2(\theta)+\beta \rVert\theta\lVert^2$
$\beta$ 表示的是权值衰减(weight decay)。 $\alpha$ 的初始值设置得比较高以使得训练过程稳定，因为训练开始的阶段递归更容易收敛。随着训练的进行， $\alpha$ 逐渐衰减来提升最终输出的性能。