- 文章出自ECCV2018:Image Super-Resolution Using Very Deep Residual Channel Attention Networks
- 这篇论文前面的related work部分写得很精彩
- 文章主要idea是提出了Residual in residual(RIR)结构和Channel Attention (CA) 结构,并整体提出了用于SR的RCAN网络
- 思路也写得很清楚,先用一层卷积提取shallow feature, 随后是RIR网络提取deep feature, 然后是upscale 层,然后是reconstruction,一共四步
- CA的机制是这样的:先全局平均池化(也可采取其它方法)产生一维vector,用该vector经过1d-conv层(个人觉得可以用linear层)和relu实现down scaling,再upsample回原来的特征数(文中没有说用什么方法,应该还是 deconv 之类的),然后sigmoid,产生attention的权重来乘以各自的channel
- 每块RCA的结构是这样的,先将input conv-relu-conv,然后将得到的特征map经过CA,得到attention后的res,与input相加得到output
- 模型的细节:RG10层,每层20个RCAB,卷积层多是64filters,3*3,除了CA中1d-conv使用的是1*1,4filters(也即r=16)
upscale层用的是espcn - 模型效果,在set5上取得了37.9的PSNR值,具体看论文,大概效果就是,能够使更deep的网络有性能上的提升
RCAN
最新推荐文章于 2024-05-27 10:39:22 发布