ICML2021｜超越SE、CBAM，中山大学开源SAM：无参Attention！

最新推荐文章于 2025-03-06 19:02:40 发布

极市平台

最新推荐文章于 2025-03-06 19:02:40 发布

阅读量1.7k

点赞数 2

分类专栏：计算机视觉文章标签：深度学习计算机视觉注意力机制

本文链接：https://blog.csdn.net/Extremevision/article/details/118995126

版权

本文介绍了中山大学提出的SimAM，这是一种无参数的3D注意力模块，受神经科学启发，通过能量函数计算神经元重要性。SimAM通过解析解加速计算，适用于各种任务，如ImageNet分类、COCO检测与分割，展现出良好的灵活性和有效性。相比于其他注意力机制，SimAM在性能和效率上具有优势，且不增加额外参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文首发于极市平台，作者： @Happy ，转载须经授权并注明来源

标题&作者团队

code: https://github.com/ZjjConan/SimAM

本文是中山大学在注意力机制方面的尝试，从神经科学理论出发，构建了一种能量函数挖掘神经元重要性，并对此推导出了解析解以加速计算。通过ImageNet分类、COCO检测与分割等任务验证了所提SimAM的灵活性与有效性。值得一提的是，所提SimAM是一种无参数注意力模块。

Abstract

本文提出一种概念简单且非常有效的注意力模块。不同于现有的通道/空域注意力模块，该模块无需额外参数为特征图推导出3D注意力权值。具体来说，本文基于著名的神经科学理论提出优化能量函数以挖掘神经元的重要性。本文进一步针对该能量函数推导出一种快速解析解并表明：该解析解仅需不超过10行代码即可实现。该模块的另一个优势在于：大部分操作均基于所定义的能量函数选择，避免了过多的结构调整。最后，本文在不同的任务上对所提注意力模块的有效性、灵活性进行验证。

本文主要贡献包含以下几点：

受启发于人脑注意力机制，本文提出一种3D注意力模块并设计了一种能量函数用于计算注意力权值；
本文推导出了能量函数的解析解加速了注意力权值的计算并得到了一种轻量型注意力模块；
将所提注意力嵌入到现有ConvNet中在不同任务上进行了灵活性与有效性的验证。

Method

在正式介绍本文所提注意力模块之前，我们先对现有代表性注意力模块(比如SE、CBAM、GC)进行简要总结；然后，我们再引出本文所提完全不同架构的注意力模块。

Overview of Existing Attention Modules

上图a与b列出了现有两种类型的注意力模块：

通道注意力：1D注意力，它对不同通道区别对待，对所有位置同等对待；
空域注意力：2D注意力，它对不同位置区别对待，对所有通道同等对待。

以下图为例，SE缺失了关于"grey_whale"的某些重要成分。我们认为3D注意力比1D和2D更佳，进而提出了上图c的3D注意力模块。

现有注意力模块的另一个重要影响因素：权值生成方法。现有注意力往往采用额外的子网络生成注意力权值，比如SE的GAP+FC+ReLU+FC+Sigmoid。更多注意力模块的操作、参数量可参考下表。总而言之，现有注意力的结构设计需要大量的工程性实验。我们认为：注意力机制的实现应当通过神经科学中的某些统一原则引导设计。

Our Attention Module

已有研究BAM、CBAM分别将空域注意力与通道注意力进行并行或串行组合。然而，人脑的两种注意力往往是协同工作，因此，我们提出了统一权值的注意力模块。

为更好的实现注意力，我们需要评估每个神经元的重要性。在神经科学中，信息丰富的神经元通常表现出与周围神经元不同的放电模式。而且，激活神经元通常会抑制周围神经元，即空域抑制。换句话说，具有空域抑制效应的神经元应当赋予更高的重要性。最简单的寻找重要神经元的方法：度量神经元之间的线性可分性。因此，我们定义了如下能量函数：
$e_t(w_t, b_t, y, x_i) = (y_t - \hat{t})^2 + \frac{1}{M-1}\sum_{i=1}^{M-1}(y_o - \hat{x_i})^2$
其中，

最低0.47元/天解锁文章