超分：Single Image Super-Resolution via a Holistic Attention Network

最新推荐文章于 2024-06-05 09:58:23 发布

wrongplanet

最新推荐文章于 2024-06-05 09:58:23 发布

阅读量2.6k

点赞数 2

文章标签：计算机视觉卷积

本文链接：https://blog.csdn.net/wrongplanet/article/details/115364106

版权

超分：Single Image Super-Resolution via a Holistic Attention Network

摘要
主要亮点
HAN网络架构
实验过程
总结

摘要

from ECCV2020
在单图像超分辨率任务中，已有的通道注意方法可以有效保存每一层具有丰富信息的特征。然而，通道注意将每个卷积层独立处理，却忽略了不同层之间的相关性。为了解决这一问题，作者提出了一种整体注意网络——HAN，该模型由层次注意模块（LAM）和通道-空间注意模块（CSAM）组成，以模拟不同层、通道和位置之间的整体关系，获得更好的超分效果。

主要亮点

提出了一种新的超分算法——整体注意网络HAN，提高了超分辨率的特征表示能力；
引入了层次注意模块(LAM)，考虑多尺度层次之间的相关性来学习得到层次特征的权值，同时提出了通道-空间注意模块（CSAM）来学习每一层特征的通道和空间相关性；
本文提出的两个注意模块通过对分层层次、通道和位置之间的信息特征进行建模，共同提高了处理结果。

HAN网络架构

1.网络组成

HAN网络主要可分为四部分：特征提取、LAM模块、CSAM模块和最终的重建块。
在这里插入图片描述

特征提取

首先对输入的LR图像进行卷积提取浅层特征：
在这里插入图片描述
然后使用RCAN网络的框架，设置N个residual group（RG）得到中间特征：
!](https://img-blog.csdnimg.cn/20210401092500283.png)

整体注意

对提取到的特征进行整体特征加权，包括：i）对层级特征即各 $F_i$ 的层次注意 ii）对RCAN最后一层即 $F_N$ 的通道-空间注意:
在这里插入图片描述
1.其中 $H_{LA}$ 表示LAM模块, L从RGs的输出特征中学习特征相关矩阵，然后为各 $F_i$ 加权。结果表明，该方法能够增强高贡献的特征层，抑制冗余特征层。

2. $H_{CSA}$ 表示CSAM模块。通道-空间注意的目的是通过调节特征，自适应地捕捉通道间和通道内更重要的信息，以便最终的重建处理。基于准确性与效率的权衡考量，此步只以 $F_N$ 作为输入。

图像重建

在LAM和CSAM分别提取特征后，对两者结果联合处理，采用亚像素卷积的上采样方法
在这里插入图片描述
$U_↑$ 代表亚像素卷积操作， $F_0$ 、 $F_L$ 、 $F_{CS}$ 分别代表初始输入，LAM层处理结果和CSAM层处理结果。

损失函数

在这里插入图片描述
本方法采用了简单的 $L_1 distance$ 作为损失函数。上式m表示参与训练的数据对数。后续的验证实验可以证明，L1损失已能够取得较好效果。

2.LAM模块

在这里插入图片描述
本模块的输入是从 $N$ 个residual group提取到的各层次特征图，维度为 $N \times H \times W \times C$ ，并将其reshape至 $N \times H W C$ 维度，和对应的转置矩阵进行矩阵相乘，计算得到各层之间的相关系数 $W_{la}={w_{i,j=1}}^N$ ,
在这里插入图片描述
$δ$ 表示softmax， $ψ$ 表示reshape操作， $w_{i,j}$ 代表第i个和第j个特征图间的相关系数。将变形各矩阵加权相乘再加上原矩阵，得到 $F_{L_j}$ .

在这里插入图片描述
$α$ 为比例因子，初始化为0，在后续各epoch自动调整更新。最终的带权和能够着重关注信息丰富的特征部分。

3.CSAM模块

在这里插入图片描述
将最后一层的特征图 $F_N$ 作为输入，通过三维卷积层获得通道和空间特征 $W_{csa}$ ，这样可以得到更有效地通道内和通道间信息。

此外，将注意力映射图 $W_{csa}$ 和输入特征 $F_v$ 进行元素乘法运算。最后，将加权后的结果乘以一个比例因子 $β$ ，再加入输入特征 $F_N$ 得到加权特征 $F_{cs}$ .其中 $σ$ 为sigmoid函数， $β$ 为比例因子，初始化为0。

实验过程

1.相关设置

数据集:DIV2K做训练集；Set5 ，Set14，B100，Urban100和Manga109做测试集。
通过双线性插值和模糊降尺度退化模型得到退化数据集。经过HAN重构的RGB结果转换到 $YC_bC_r$ 空间，在实验中只考虑亮度通道来计算PSNR和SSIM。
实现细节:使用PyTorch平台和预先训练的RCAN (x2)， (x3)， (x4)， (x8)模型来分别初始化相应的HAN网络。
patch size: 64 × 64。
batch size: 16
优化器：ADAM
学习率: $10^{-5}$
数据增强方法：随机旋转和平移
Residual Group数量：10
epoch：250个
在Nvidia GTX 1080Ti GPU训练，时长约两天。

2.LAM和CSAM的消融实验

在这里插入图片描述

3.Residual Group个数的消融实验

在这里插入图片描述

4.CSAM个数的消融实验

可以观察到不同CSAM个数对最终结果影响甚微。
在这里插入图片描述

5.BI退化模型下实验结果

定量
视觉效果

总结

本文中提出了一种用于单图像超分辨率的整体注意网络，该网络利用自我注意机制自适应地学习不同深度、通道和位置之间的全局依赖关系。具体来说，是学习层注意模块捕获层次层之间的远程依赖关系。同时，通道-空间注意模块整合了每一层的通道信息和语境信息。这两个注意模块协同应用于提取多层次的特征，可以获取更多信息。在基准数据集上的大量实验结果表明，该模型在精度和视觉质量方面优于最先进的SR算法。

【论文链接】：http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123570188.pdf.

wrongplanet

关注

2
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
超分：Single Image Super-Resolution via a Holistic Attention Network

超分：Single Image Super-Resolution via a Holistic Attention Network超分：Single Image Super-Resolution via a Holistic Attention Network摘要主要亮点HAN网络架构1.网络组成2.读入数据总结新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义
复制链接

扫一扫