文章目录
前言
1、首先此次超清重建(SR)使用的不是插值之类的传统方法,而是使用的深度学习法。(插值法就是把像素等比例拉伸,拉伸之后中间会出现空白点,这些空白的点根据之前拉伸的店进行均匀过度)
2、其次,SR问题如果使用深度学习方法,一般有两种解决思路:
- 基于单张图片去SR,就是依靠现有低频信息去猜高频信息,中途用了很多数学知识,建立模型,最终就看高频信息能不能猜的准,猜得准这个模型就好用;但是这个过程就很麻烦,费时间。
- 另外的基于参考图像方法,顾名思义,我先搜一张和原图差不多的图像,我看看他的低频信息和高频信息是怎么联系起来的,之后我再照猫画虎去推导本图像的高频信息。
- 而我就是用的第一种方法中的EDSR模型来实现超分辨率重建
3、最后,本文主要讲解EDSR都包含哪些模块?以及每个模块的作用是什么?但是对于为什么该团队偏偏使用了这些模块,在该团队的论文中以及我能查找的文献中没有说明。再加上本人能力有限,这类问题将会先行放过。
EDSR 模型架构
简介
- EDSR模型,全称为enhanced deep super-resolution network(增强的深度学习超分辨率重建网络)
在本文中,EDSR主要具有两大特点:
- 使用了ResNet残差思想
- 移除了batchnorm(就是常说的BN层-批处理层,后面会解释)
EDSR模型包含以下层/模块:
- Conv层(卷积层)
- ReLu激活层
- Mult层(残差缩放层)
- ResBlock(残差块)
- UpSample (上采样模块)。
- Shuffle层
图像输入之后,会先进行卷积、激活、残差缩放,学习到图片的高频特征,之后再进行upsample上采样(上采样对应的是下采样池化,上采样是进行分辨力增加的步骤)进行图像的最终超清晰度重建。
EDSR模型的简单架构如图:
接下来就会详细讲解这些层/模块的作用。
1、Conv层(卷积层)
卷积层的作用:
- 提取图像的特征,并且卷积核的权重是可以学习的,卷积操作能突破传统滤波器的限制,根据目标函数提取出想要的特征;
- 参数共享(一个卷积核用来滤整个图像,而不是很多个卷积核),