SwinIR简记
- 快速看了一眼原文,的确是将swin transformer用到了SR,本身似乎并没有太多的亮点,但是实打实的有效~
参考
简述
-
看之前我特地再去看了一下Swin Transformer的原文(笔记:Swin Transformer),然后再看这篇发现确实如开头所说
-
首先是模型结构:
-
大致分为三个部分
- Shallow Feature Extraction
- Deep Feature Extraction
- HQ Image Reconstruction
-
源码中的大致分布如下:
-
其实作者的代码写的比较好懂,其中13部分主要是conv为主,或有修改,而第二部分就是引入了Swin Transformer模块,大致的结构大约是这样的:
- self.layers = [RSTB]*n
- RSTB = BasicLayer + conv + skip connection
- BasicLayer = [SwinTransformerBlock]*depth + downsample(注意这里是None也就是说这里的特征大小一直没有变!)
- 而SwinTransformerBlock 又分为W-MSA和SW-MSA两种,是交替出现的
总结
- Swin Transformer🐮🍺