论文学习使用非常深的卷积神经网络实现单图片超分辨率

最新推荐文章于 2023-06-18 20:27:43 发布

Lyrig~

最新推荐文章于 2023-06-18 20:27:43 发布

阅读量395

点赞数 1

文章标签： cnn 学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55471672/article/details/125911740

版权

论文学习使用非常深的卷积神经网络实现单图片超分辨率

前言
引言
背景介绍（这一部分从简）
论文连接

前言

笔者为了和女朋友在一起做暑期研究，为了实现图片超分辨率，便搜索了这篇论文，也可以作为自己的读书笔记吧。此时笔者正值大一，有许多专有名词翻译未必恰当，如有错误欢迎批评指正，也希望各位有取舍的看，有不明白的地方可以留言，当然自己查原文或许更好。

侵权删，并退还所有可能收益。

引言

我们使用了非常深的卷积神经网络，这一想法是受到了VGG-net的在图像网络分类工作的启发。我们发现，随着提高卷积神经网络的深度，图像超分辨率的实现效果越来越好，本文最终的模型使用了20层带权重的卷积层。通过在深层网络架构中重叠小尺寸卷积核多次，一张大尺寸图片不同区域的细节信息就可以被有效的发掘。

深层网络虽然性能优秀，但其训练过程的收敛速度是一个大问题。我们提出了一种简单但是有效的训练方式——我们只学习残差，并使用比较大的学习率（是SRCNN的10⁴倍）并且能梯度调节。

背景介绍（这一部分从简）

我们解决了基于给定的低分辨率（LR）图片实现高分辨率（HR）图片的方法，这种关于单图片超分辨率（SISR）的研究已经应用于计算机视觉领域。

以前的研究

插值法

双三线性插值、兰索斯重采样（Lanczos resampling）等，这些方法基于统计得出的图片的先验知识和图片内部的重复特征。

机器学习

该方法分为几类：

学习一个函数，即从LR图像映射到HR图像的函数。
邻近节点压缩可以作用于局部区域.
稀疏编码用于学习一个稀疏的字典，基于对信息的稀疏表示。
随机森林、卷积神经网络在最近研究中取得突破。

个人感觉邻近节点压缩、稀疏编码其实本质差不多，其目的是为了提取图像中的细节特征，再对特征进行还原，笔者之前翻译的一篇文章可以很好地介绍这一现象，虽然那篇论文并没有使用稀疏编码提取特征（采用了强化学习），不过或许可以作为一个思路，进行改善？

其中涉及的映射函数，其实就是上述的映射函数，也就是说上述方法并非孤立的，而是可以相互搭配使用。

SRCNN的优势和不足

前人的研究已经证明卷积神经网络（CNN）能够以一种端到端的方式学习从LR到HR的映射函数。SRCNN不需要任何加工过的特征（这一点在其他的方法中往往是需要的），并展现了先进的性能。

但是这种方法任然存在不足：

SRCNN需要小图片的周围区域
训练时，网络收敛缓慢
该神经网络只适用于单一规模(scale，比例)

我们的改进

上下文语境（Context，背景）

我们利用分布在大尺寸图片区域的上下文信息，对于大尺寸因素，最常见的问题是存在于小的区域内的信息不足以被细节发掘（错误提取），我们的非常深的神经网络采用了大的感受野，将整张照片考虑在内。

收敛（Convergence）

我们提出了一种方式加速训练：残差CNN和高学习率。

由于LR图像和HR图像在广义上（在大部分区域）共享相同的信息，因此采用照片残差（体现了LR和HR图片的不同之处）进行训练是更加合理且有优势的。我们提出的结构对于输入输出具有很强关联的信息，十分有效。除此之外，我们将学习率设置为比SRCNN高10⁴，这是通过残差学习和梯度调整实现的。

比例因素（Scale Factor，规模因素）

我们的贡献

论文连接

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
论文学习使用非常深的卷积神经网络实现单图片超分辨率

笔者为了和女朋友在一起做暑期研究，为了实现图片超分辨率，便搜索了这篇论文，也可以作为自己的读书笔记吧。此时笔者正值大一，有许多专有名词翻译未必恰当，如有错误欢迎批评指正，也希望各位有取舍的看，有不明白的地方可以留言，当然自己查原文或许更好。侵权删，并退还所有可能收益。我们解决了基于给定的低分辨率（LR）图片实现高分辨率（HR）图片的方法，这种关于单图片超分辨率（SISR）的研究已经应用于计算机视觉领域。
复制链接

扫一扫

Lyrig~ CSDN认证博客专家 CSDN认证企业博客

码龄3年

52: 原创

104万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

794: 积分

192: 粉丝

255: 获赞

27: 评论

266: 收藏

私信

关注

热门文章

分类专栏

最新评论

CS285 2023Fall HW1作业解析
qq_51386299: 求更新！！！
CS285 2023Fall HW1作业解析
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
论文 One-Inlier is First: Towards Efficient Position Encoding for Point Cloud Registration
Lyrig~: 不太清楚哎，或许找找这篇论文？也许能找到？
论文 One-Inlier is First: Towards Efficient Position Encoding for Point Cloud Registration
qq_45914731: 请问有没有代码呢
暑研项目回顾使用Attention-Unet实现对细胞核的Image Segmentation
Lyrig~: 非常抱歉，因为早就离开那个实验室了，所以之前的代码和结果全都存在那个服务器了，后来因为实验室服务器的调整导致校外学生没法登陆了，真的不好意思。就您说的问题，我个人认为有可能是数据集的问题，不妨先看看数据集是什么样子的，然后再修改吧。而且这个模型其实很弱，感觉都不配叫（分割），可以看看Segment Everything。之类的SOTA模型，它是开源的，或许效果比我的要好太多了~十分抱歉~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。