本文提出一种新的基于DCT频率域的通道注意力,其在分类、检测和分割任务上,性能优于SENet、CBAM和GCNet等主干,代码和模型即将开源!
注:文末附计算机视觉交流群
FcaNet: Frequency Channel Attention Networks
- 作者单位:浙江大学(李玺团队)
- 代码:https://github.com/dcdcvgroup/FcaNet
- 论文:https://arxiv.org/abs/2012.11879
注意力机制,尤其是通道注意力,在计算机视觉领域取得了巨大的成功。许多工作专注于如何设计有效的通道注意力机制,同时忽略一个基本问题,即使用全局平均池(GAP)作为毫无疑问的预处理方法。
在这项工作中,我们从不同的角度出发,并使用frequency analysis重新考虑通道的注意力。基于频率域分析,我们在数学上证明了传统的GAP是频域中特征分解的特例。有了证明,我们自然地在频域上概括了通道注意力机制的预处理,并提出了具有新颖的multi-spectral通道注意力的FcaNet。