BAM: Bottleneck Attention Module

椰子奶糖

已于 2022-04-04 17:14:39 修改

阅读量817

点赞数 1

分类专栏： # 论文阅读杂记文章标签：深度学习

于 2021-10-14 21:05:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/symuamua/article/details/120772782

版权

论文阅读杂记专栏收录该内容

51 篇文章 1 订阅

订阅专栏

BAM

文章目录

- - BAM

参考

个人理解

题外话：看完CBAM然后再看BAM，一个团队在同一天挂的两篇文章，妙啊妙啊，而且结构上也有相似之处，如果读过CBAM（参考CBAM: Convolutional Block Attention Module），那么BAM看看图和公式就可以理解了
这个结构分也为两部分，关注下图红框的部分，分别为Channel attention和Spatial attention，与CBAM不同的是这俩是并行的这就比较有意思了，CBAM中的Channel和Spatial结构说是串行比较好，这里的结构说是并行比较好，这点是写的时候突然想到的，还没想明白～～

在这里插入图片描述

Channel attention

先看Channel attention

在这里插入图片描述

input是Feature Map，对HxW面做一次全局AvgPool，然后再走MLP（至于MLP的结构看上图中结构大致就知道了就是两个FC中间夹个dropout (C/r)这个样子，或者去看看CBAM: Convolutional Block Attention Module这篇对应部分原理是一样的，只是图不同），最后归一化就是Channel attention了，公式如下：

在这里插入图片描述

Spatial attention

然后看Spatial attention

在这里插入图片描述

这个也比较一目了然，先通过1x1减少channel数（同时减少参数），然后走两个conv提Spatial的Feature，再走一个1x1减少channel到1，输出的是channel为1的Feature Map，当然另外两维还是HxW，公式的话就这样：

在这里插入图片描述

结构合并

合并的时候关注这部分：

在这里插入图片描述

首先要把这里加起来
- 然后整体点乘加残差
- 起初我还没理解这个加号是啥意思，翻了翻代码，代码上的实现是‘*’，也就是元素点乘：
- ```
class BAM(nn.Module):
    def __init__(self, gate_channel):
        super(BAM, self).__init__()
        self.channel_att = ChannelGate(gate_channel)
        self.spatial_att = SpatialGate(gate_channel)
    def forward(self,in_tensor):
        att = 1 + F.sigmoid( self.channel_att(in_tensor) * self.spatial_att(in_tensor) )
        return att * in_tensor
```
- 稍微研究一下上面的代码不难发现，att * in_tensor是这么个逻辑：F(1+M(F))，因此得出结论上面第一个公式中的加号应该是元素点乘，属于笔误
- 经一位老哥提醒，这可能是作者做comparison experiments忘记改回去了，实际上却是是+，如对任何人造成困扰，十分抱歉！
然后我研究了下‘*’这个符号的计算过程，如下所示，如果不同形状的点乘会先得到下面的结果：

如何融入ResBlock中？

作者给的图上画着这个是加载block之间的，而CBAM是加载block内部的，但实际上我认为可以任意位置

效果如何？

和CBAM的对应实验比较一下就知道这个结构的整体效果不如CBAM
结尾可能有点意思的参考文献：42、27、26、9

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
3
评论
BAM: Bottleneck Attention Module

BAM文章目录BAM参考个人理解Channel attentionSpatial attention结构合并如何融入ResBlock中？效果如何？参考CBAM: Convolutional Block Attention Module原文个人理解题外话：看完CBAM然后再看BAM，一个团队在同一天挂的两篇文章，妙啊妙啊，而且结构上也有相似之处，如果读过CBAM（参考CBAM: Convolutional Block Attention Module），那么BAM看看图和公式就可以理解了这
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

椰子奶糖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。