YOLOV8改进：两种添加CBAM注意力机制的方法

最新推荐文章于 2025-04-15 15:35:31 发布

Ice_phyllium

最新推荐文章于 2025-04-15 15:35:31 发布

阅读量2.1k

点赞数 21

文章标签： YOLO pytorch 人工智能深度学习 python

本文链接：https://blog.csdn.net/BingYelly/article/details/137037489

版权

本文介绍了CBAM注意力机制及其在YOLOV8中的两种不同位置的添加方式，包括SPPF模块后和三个分支上。作者提供了改进后的代码包，便于快速集成和使用，适用于科研和毕业设计

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近阅读了一些论文，发现两种CBAM添加使用方法，我进行了实现。首先介绍CBAM注意力机制。

CBAM（Convolutional Block Attention Module）,结构如下图所示：

可以看到 CBAM 包含2个独立的子模块，通道注意力模块（Channel Attention Module，CAM) 和空间注意力模块（Spartial Attention Module，SAM) ，分别进行通道与空间上的 Attention 。这样不只能够节约参数和计算力，并且保证了其能够做为即插即用的模块集成到现有的网络架构中去。

（一）、Channel Attention Module（CAM）
通道上的Attention模块以及具体计算如下图所示：

具体流程如下：
将输入的特征图F（H×W×C）分别经过基于width和height的global max pooling（全局最大池化）和global average pooling（全局平均池化），得到两个1×1×C的特征图，接着，再将它们分别送入一个两层的神经网络（MLP），第一层神经元个数为 C/r（r为减少率），激活函数为 Relu，第二层神经元个数为 C，这个两层的神经网络是共享的。而后，将MLP输出的特征进行基于element-wise的加和操作，再经过sigmoid激活操作，生成最终的channel attention feature，即M_c。最后，将M_c和输入特征图F做element-wise乘法操作，生成Spatial attention模块需要的输入特征。
（二）、Spatial Attention Module（SAM）
空间上的Attention模块以及具体计算如下图所示：

具体流程如下：
将Channel attention模块输出的特征图F‘作为本模块的输入特征图。首先做一个基于channel的global max pooling 和global average pooling，得到两个H×W×1 的特征图，然后将这2个特征图基于channel 做concat操作（通道拼接）。然后经过一个7×7卷积（7×7比3×3效果要好）操作，降维为1个channel，即H×W×1。再经过sigmoid生成spatial attention feature，即M_s。最后将该feature和该模块的输入feature做乘法，得到最终生成的特征。

上文原文链接：http://t.csdnimg.cn/keVRz

然后再谈谈我使用CBAM如何对YOLOV8进行改进的。

第一种，也是最常见的一种，将CBAM模块添加到SPPF模块后面的位置，如下图：