SwinIR: 基于Swin Transformer的图像重建网络

SwinIR: Image Restoration Using Swin Transformer

简介

论文地址:SwinIR: Image Restoration Using Swin Transformer

代码:SwinIR

​ 本文提出了一个基于swin transformer的图像超分模型swinIR。其中SwinIR分为三部分:浅层特征提取、深层特征提取和高质量图像重建模块。

现阶段问题

vanilla transformer通过注意力捕获了全局依赖,但是它是将图片达成patch进行输入,这样在图像超分领域出现了两个问题。

  • 重建图像在每个小块附近存在边界伪影
  • 边界像素会丢失信息。

虽然通过patch重叠,能进行缓解,但是也带来额外计算负担。

主要贡献

​ 将Swin Transformer应用于low-level任务中。

网络框架

​ 采用shallow feature进行浅层特征提取后,输入到RTSB(多个swin transformer残差块)进行深层的特征提取,最后使用高质量图像重建模块(卷积和上采样操作)进行图像重建。

2023-11-22_09-50-50

浅层特征提取

​ 在浅层特征提取中是采用的几个简单卷积层进行提取,因为卷积层对视觉任务的前期处理,一般对结果以及优化产生好的影响。

​ 见这篇论文:Early Convolutions Help Transformers See Better

深层特征提取

​ RTSB是采用使用多个STL块并在最后使用一个conv层进行特征聚合(将卷积操作的归纳偏差引入基于 Transformer 的网络),同时还采用了残差结构。

HQ图像重建

​ 采用残差连接将浅层特征和深层特征进行跳跃连接(浅层特征主要包含低频,深层特征侧重于恢复丢失的高频),对于图像超分重建部分,则是采用了PixelShuffle进行实现。

损失

​ 经典和轻量级的图像 SR,我们只使用与之前工作相同的原始 L1 像素损失来展示所提出网络的有效性。对于真实世界的图像SR,我们使用像素损失、GAN损失和感知损失的组合来提高视觉质量。


参考资料

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Miracle Fan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值