论文笔记(VDSR)

三斤驴肉花

已于 2023-03-04 19:43:00 修改

阅读量346

点赞数

文章标签：论文阅读计算机视觉深度学习 Powered by 金山文档

于 2023-03-04 17:18:26 首次发布

本文链接：https://blog.csdn.net/Karl51/article/details/129336805

版权

3.VDSR

1.研究背景：

虽然SRCNN成功地将深度学习技术引入了超分辨率问题，但我们发现它在三个方面存在局限性。

2.存在问题：

1.它依赖于小图像区域的上下文。

2.训练收敛得太慢。

3.网络只适用于单一规模。

3.改进思索：

提出了一种加速训练的方法:残差学习和极高的学习率。由于LR图像和HR图像在很大程度上共享相同的信息，明确地对HR图像和LR图像之间的差异即残差图像进行建模具有优势。通过残差学习和梯度裁剪实现VDSR的初始学习率比SRCNN高104倍。

尺度通常是用户指定的，可以是任意的，包括分数。如果按照SRCNN的方法训练和存储许多依赖于不同比例的模型来为所有可能的场景做准备是不切实际的。

4.解决方案：

提出了一种基于深度卷积网络的高精度SR方法。用残差学习和梯度裁剪解决了使用小的学习率会使深度网络收敛得太慢，使用大的学习率提高收敛速度会导致梯度爆炸的问题，保证了训练的稳定性。此外，将工作扩展到用单个网络处理多尺度SR的问题。

网络模型：

第一层对将插值后的低分辨率图像(所需的大小)进行操作，中间用d层相同的卷积和激活函数，最后一层用于图像重建，每个卷积层均进行零填充操作保证输入输出图像大小保持一致。用残差结构来解决梯度消失或爆炸的问题。损失包括残差估计，网络输入和真实HR图像三个输入。

梯度裁剪：

SRCNN的学习率10−5对于一个网络来说太小了，无法在一个通用GPU上在一周内收敛。提高学习率来促进训练是一个基本的经验法则。但简单地设置高学习率也会导致梯度消失或爆炸。因此，VDSR用一个可调的梯度裁剪，加速拟合，同时抑制爆炸梯度，将梯度裁剪到[−θ/γ，θ /γ]之间，其中γ表示当前的学习率。