VDSR：基于深度卷积神经网络的实现精确图像超分辨率重建(2016)

最新推荐文章于 2023-03-04 17:18:26 发布

Fraps_

最新推荐文章于 2023-03-04 17:18:26 发布

阅读量2.8k

点赞数 4

分类专栏：超分辨率重建机器学习深度学习文章标签：超分辨率重建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fraps_/article/details/95771712

版权

机器学习同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

超分辨率重建

3 篇文章 0 订阅

订阅专栏

Abstract

我们提出一个高精确度的单张图像超分辨率重建方法。我们的方法由VGG-net启发,我们发现，网络的深度对于超分精确度有着十分重要的的影响，我们最终的网路有20层。通过这么多小尺寸的卷积层，有效的利用了图像中的上下文信息，面对深度网络难以训练的问题，我们使用大的学习率、梯度剪裁来解决这个问题。最后，实验证明我们提出的方法十分有效。

Intoduction

超分辨重建十分常用，广泛用于安全、监视、医疗等需要图像细节的领域。
在计算机视觉领域已经提出了很多的方法了，早期的方法比如bicubic插值、Lanczos resampling、基于utilizing statistical image priors、基于internal patch recurrence。
当前，最流行的时学习LR到HR之间映射关系的基于学习的方法。比如，Neighbor embedding、Sparse coding、random forest、convolutional neural network。
在这些当中，SRCNN开启了基于深度学习的超分方法。然而我们发现，这种方法有如下几个方面的局限：

算法依赖于小范围的图像区域
算法的训练很慢
算法只能针对单张图像做超分
本文针对这个问题，提出了新的解决方法。

Context

我们提出的网络能过捕获到大图像区域。对于大尺度的超分，需要更宽的感受野来提供足够的细节信息，所以需要十分深的网路。

Convergence

使用大学习率、残差学习。LR与HR在很大程度上是十分相识的，所以残差学习十分有用，同时在输入与输出相似度很大时，大的学习率对于网路的收敛十分有效。

Scale Factor

我们的网络是Scale free的，尺度有用户定义。

Contributon

本文提出了一个十分深的卷积网路来实现超分辨率重建，这个方法十分有效，测试结果如图：
VSDR

Related work

这里作者纠正了SRCNN文中的错误观点：深度网络对超分无用。

Proposed Method

VDSR网络结构

除了第一层和最后一层，其他层的参数是：3X3X64
都知道，卷积操作会使得输入图像变小，这里，作者用零填充，使得经过每层网络后输入尺寸与输出尺寸相同。
在网络的最后会让网络学习的细节信息与输入图像融合，最终得到HR图像。
网络的loss有点不同：
$先构建残差图片 r = y - x, x 是 L R 图片， y 是 H R 图片,$
$loss=\frac {1} {2}||r-f(x)||^2$

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
VDSR：基于深度卷积神经网络的实现精确图像超分辨率重建(2016)

Abstract我们提出一个高精确度的单张图像超分辨率重建方法。我们的方法由VGG-net启发,我们发现，网络的深度对于超分精确度有着十分重要的的影响，我们最终的网路有20层。通过这么多小尺寸的卷积层，有效的利用了图像中的上下文信息，面对深度网络难以训练的问题，我们使用大的学习率、梯度剪裁来解决这个问题。最后，实验证明我们提出的方法十分有效。...
复制链接

扫一扫

专栏目录

Fraps_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

25: 原创

11万+: 周排名

86万+: 总排名

2万+: 访问

: 等级

512: 积分

15: 粉丝

23: 获赞

7: 评论

101: 收藏

私信

关注

热门文章

分类专栏

最新评论

ESPCN：基于高效的亚像素卷积神经网络的实时单张图片与视频超分表率重构
Fraps_: https://github.com/jmiller656/EDSR-Tensorflow/blob/master/utils.py#L30 参考这里的实现。
ESPCN：基于高效的亚像素卷积神经网络的实时单张图片与视频超分表率重构
weixin_47102310: X = tf.reshape(I, (bsize, a, b, c/(r*r), r, r))总是在这一行提示错误。TypeError: Expected int32, got 8.0 of type 'float' instead.
ESPCN：基于高效的亚像素卷积神经网络的实时单张图片与视频超分表率重构
weixin_47102310: 博主您好，我想把sub-pixel插入到卷积网络中，代替上采样，但是总是报错，说格式不对，应该如何处理
ESPCN：基于高效的亚像素卷积神经网络的实时单张图片与视频超分表率重构
Fraps_ 回复 qq_44796499: 不好意思这才回你，对于第一个问题，我现在认为是作者自己强塞的，到目前，神经网络也是凭经验、实验性的，没有太多理论上的东西，提出的模型有效果后，再反过来解释；对于第二个问题，要深究的话要去看第一个提出“反卷积”这个概念的文章，对于本文提到的sub-pixel,再github上有实现，而且再以后很多超分模型都在用这功能，附地址：https://github.com/tetrachrome/subpixel
ESPCN：基于高效的亚像素卷积神经网络的实时单张图片与视频超分表率重构
qq_44796499: 博主，您好，我最近在学习有关图像超分辨的知识，感谢您写了这篇博客，我看完您这篇博客后有两个问题:第一个是该神经网络为什么可以依赖神经网络的学习能力，在网络的第一层，让它去自适应的习得一个灵活的滤波器。在别的博客中也写到什么插值函数被隐含地包含在前面的卷积层中，我也不太理解这种解释。第二个是最后一层网络，也就是sub-pixel卷积层为什么是属于反卷积。望能得到博主的解答，感激不尽！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。