Uformer: A General U-Shaped Transformer for Image Restoration 论文笔记

前言

借鉴了图像分割和识别网络那边的Unet运用到图像恢复领域上,主要包括图像降噪、运动去模糊、失焦模糊和去雨四个任务。

创新点:

①提出了一种新的基于Transformer结构的自注意力模块,类似于SWIR。

②提出了一种可以学习的多尺度调制器嵌入到解码器中。

网络结构

整体网络结构其实就是Unet,但是里面的模块不一样。

首先,输入时一个3×H×W的图像,然后经过一个3×3的卷积核和LeakyReLU激活函数组成的卷积层提取特征,即为图中的Input Projection,输出为C×H×W的特征层。然后进入网络前半部分,编码器,是由K个LeWin Blocks组成的(实验结果显示K=4结果较好),每一层都是先经过LeWin模块后再经过一个下采样层,通道数翻倍,长宽减半,与解码器后面对应相同大小的特征进行叠加。

LeWin Transformer模块

这个模块在论文中说的目的是为了增强局部特征,减少计算量。这个计算量是相对整幅图像进行注意力计算,只不过将图像分成很多子图像进行注意力计算。但是,本质上来说其实就是局部注意力机制,将图像分成M×M个子图像,然后分别对每个子图像内部进行注意力计算,存在的问题其实是子图像和子图像之间没有信息交互。其实SWIN Transformer 就是在做这样一件事,但是还加上了移动的窗口,所以效果会更好。

Locally-enhanced Feed-Forward

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值