自注意力机制改良目标检测

最新推荐文章于 2024-01-12 21:23:00 发布

拉姆他

最新推荐文章于 2024-01-12 21:23:00 发布

阅读量1k

点赞数

文章标签：人工智能神经网络目标检测

本文链接：https://blog.csdn.net/tony_starky/article/details/124495254

版权

由于卷积核作用的感受野是局部的，须累积经过许多层后才能将整个图像不同部分的区域关联起来。所以在 CVPR 2018 上出现了 SENet，从特征通道层面上统计图像的全局信息。

CBAM全称为 Convolutional Block Attention Module，它是一个卷积注意力机制模块，比SE多了一个空间（spatial）attention，两全其美。CBAM可分为2部分，先是channel attention ，和SE类似，然后是 spatial attention，它融合了2种注意力机制，可添加在任意网络的卷积层后面。CBAM的 channel attention的过程，不难看出它比SE多了一个 global max pooling。其2个池化之后的处理过程和SE一样，都是先降维再升维。spatial attention 过程它是将做完 channel attention 的feature map 作为输入，之后作2个大小为列通道的维度池化，每一次池化得到的 feature map 大小就为 h * w * 1 ，再将两次池化的 feature map 作基于通道的连接变成了大小为 h * w * 2 的 feature map ，再对这个feature map 进行核大小为 7*7 ，卷积核个数为1的卷积操作（通道压缩）再sigmod，最后就是熟悉的矩阵全乘了。