注意力机制：SENet详解

最新推荐文章于 2024-07-18 20:02:41 发布

一本糊涂张～

最新推荐文章于 2024-07-18 20:02:41 发布

阅读量1.1k

点赞数 47

分类专栏：深度学习文章标签： pytorch 人工智能深度学习

本文链接：https://blog.csdn.net/zly_Always_be/article/details/138250973

版权

深度学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

本文介绍了2017年提出的SENet模型，一种利用通道注意力机制强化特征图的深度学习架构。模型首先通过全局平均池化整合通道信息，然后通过全连接层学习通道权重，最终对特征图进行加权。文中给出了一个简单的SENet实现代码示例。

摘要由CSDN通过智能技术生成

SENet（Squeeze-and-Excitation Networks）是2017年提出的一种经典的通道注意力机制，这种注意力可以让网络更加专注于一些重要的featuremap，它通过对特征通道间的相关性进行建模，把重要的特征图进行强化来提升模型的性能。论文链接代码实现

模型

SENet的模型结果如图所示：
在这里插入图片描述
网络的输入 $X$ 是个多通道的图片，其维度为 $H',W^′,C^′]$ ，经过一系列卷积等维度变化操作后得到U，其维度是 $[H, W, C]$ ，其中C是通道的数量，那么我们融合不同通道的特征呢，这个时候就进入到了SENet，对于U，先经过全局平均池化的操作，即将U的维度由 $[H, W, C]$ 变成 $[1, 1, C]$ ，这一步对应着上图中的 $F_{sq} ( \cdot)$ ，实际上是对每一个特征图的特征通过池化的方式做了一个总结，这个总结作为初始值送入后面的多层神经网络，学习到不同通道的权重。全连接层的结构为：
在这里插入图片描述
这个多层感知机的结构非常简单，就是两个全连接层和两个激活函数，在第一次全连接层后使用Relu激活函数，此时得到的输出维度为 $[1, 1, C^{''}]$ 。第二个全连接层后使用Sigmoid函数，将每层数值归一化到0-1之间，以此表示每个通道的权重，第二个全连接的输出也为 $[1, 1, C]$ 。得到了最后 $[1, 1, C]$ 的输出后，我们将 $U$ 和刚刚得到的权重结果相乘，得到最终的特征图 $\hat X$ ，它和 $U$ 的维度一致，但是在 $\hat X$ 中，不同特征图已经根据权重结果进行了重新加权。

代码

附上SENet的一个简单实现：

def SENet(input):
    #全局平均池化
    x = nn.AdaptiveAvgPool2d((1,1))(input)
    x = x.view(1, -1)
    #第一个全连接层
    x = nn.Linear(2, 1)(x)
    x = nn.functional.relu(x)
    #第二个全连接层
    x = nn.Linear(1, 2)(x)
    x = nn.functional.sigmoid(x)

    return x


if __name__ == '__main__':
    input = torch.ones(1, 2 ,2 ,2)
    output = SENet(input)
    # 将SENet的输出维度进行变化，以便后面的乘机操作
    output = output.view(input.shape[0], input.shape[1],1, 1)
    SE_output = input*output