论文笔记 |【CVPR2022】Restormer: Efficient Transformer for High-Resolution Image Restoration

论文笔记 |【CVPR2022】Restormer: Efficient Transformer for High-Resolution Image Restoration


写在前面:
距离我上次半途而废TensorFlow笔记已经过去了整整一年半。
其实我自己也知道半途而废是不好的(笑。
承蒙本校不弃,收留我读研(bushi),本科研小白上路了。
上传自己的阅读笔记,一是方便以后查阅,二是想记录自己的水平变化,三是我确实很想当一个周更博主!

评论区欢迎指正和讨论,一起学习冲冲冲


在这里插入图片描述

1 Motivation

CNNs:
在这里插入图片描述
在这里插入图片描述
(a)接收域受限,无法对远距离像素之间的依赖关系进行建模
(b)滤波器的权重静态,不能灵活适应输入内容

Transformer:
优点:可以捕捉远距离像素之间的交互关系
缺点:计算复杂度随着空间分辨率的增加而平方增加,无法应用于高分辨率图像。

解决方法:
输入图像分为48*48的patches,独立计算每个patch的self-attention。
存在问题:
限制SA空间范围vs捕捉远距离像素之间的关系 矛盾

2 Method

在这里插入图片描述

  • 提出了一种编解码Transformer用于高分辨率图像上多尺度local-global表达学习,且无需进行局部窗口拆分;

在这里插入图片描述
编码器分层降低空间分辨率,同时扩展通道;解码器降低通道数,提升空间分辨率;
让Transformer块将编码器的低级图像特征与解码器的高级特征聚合在一起;
细化阶段进一步丰富深度特征Fd;
在这里插入图片描述

  • 提出一种MDTA(Multi-Dconv head Transposed Attention)模块,它有助于进行局部与非局部相关像素聚合,可以高效的进行高分辨率图像处理;
    在这里插入图片描述
    在这里插入图片描述
  • 提出一种GDFN(Gated-Dconv Feed-forward Network)模块,它可以执行可控特征变换,即抑制低信息特征,仅保留有用信息
    在这里插入图片描述
    归一化;第一1×1卷积:用于扩展特征通道(通常通过因子γ=4);3×3卷积:学习局部信息;
    GELU激活,点积
    第二:通道降维到原始维度,加上输入图像
    在这里插入图片描述
  • Progressive Learning
    Transformer模型在较小块上训练可能无法进行全局统计信息编码,进而导致全分辨率测试时的次优性能。
    在训练的初期,模型在较小图像块上进行训练;在训练的后期,模型采用更大图像块进行训练 。由于更大的图像块会导致更长的计算耗时,我们随图像块提升降低batch,保持训练时间不变。

3 Experiment&可视化

在这里插入图片描述

用得最多,但是其值不能很好地反映人眼主观感受。一般取值范围:20-40.值越大,视频质量越好。

SSIM(结构相似性):
计算稍复杂,其值可以较好地反映人眼主观感受。一般取值范围:0-1.值越大,视频质量越好。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
LPIPS:
学习感知图像块相似度,用于度量两张图像之间的差别。LPIPS 比传统方法(比如L2/PSNR, SSIM, FSIM)更符合人类的感知情况。LPIPS的值越低表示两张图像越相似,反之,则差异越大。
MAE(Mean Absolute Error):
平均绝对误差
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5 消融实验

在这里插入图片描述
FLOPs复杂度
Params参数量
在这里插入图片描述
1×1卷积可以进一步提升模型性能;
Progressive学习机制指标更好;
深而窄的模型比宽而浅的模型更好;

6 Conclusion

Restormer:
MDTA:
(跨通道而不是空间维度,SA,进行局部与非局部相关像素聚合,建模全局上下文+线性复杂度)
GDFN:
控制信息流动, 进而使得每层聚焦于不同的细节信息。->抑制低信息特征,仅保留有用信息。

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值