YOLOv5改进之Convolutional Block Attention Module

这糖有点苦

已于 2023-10-20 21:23:34 修改

阅读量58

点赞数

分类专栏： YOLOv5改进：从入门到实战改进文章标签： YOLO 深度学习人工智能

于 2023-10-20 21:15:56 首次发布

本文链接：https://blog.csdn.net/weixin_47060902/article/details/133954033

版权

YOLOv5改进：从入门到实战改进专栏收录该内容

20 篇文章 11 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了将卷积块注意模块(CBAM)应用于YOLOv5的实践，通过CBAM在通道和空间维度上增强特征表示。在ImageNet-1K、MS COCO和VOC 2007数据集上的实验表明，CBAM能有效提升模型性能。在YOLOv5中，CBAM被添加到backbone和neck部分，通过修改yaml配置文件和yolo.py文件完成集成。

摘要由CSDN通过智能技术生成

一、CBAM理论部分

我们提出了卷积块注意模块(CBAM)，这是一种简单而有效的前馈卷积神经网络注意模块。给定一个中间特征映射，我们的模块沿着两个独立的维度依次推断注意力映射，通道和空间，然后将注意力映射乘以输入特征映射以进行自适应特征细化。因为CBAM是一个轻量级的通用模块，它可以无缝地集成到任何CNN架构中，开销可以忽略不计，并且可以与基础CNN一起进行端到端训练。我们通过在ImageNet-1K、MS COCO检测和VOC 2007检测数据集上进行大量实验来验证我们的CBAM。

相关工作

网络工程：“网络工程”一直是最重要的视觉研究之一，因为精心设计的网络可确保在各种应用中显着提升性能。自大规模 CNN [19] 成功实施以来，已经提出了广泛的架构。一种直观且简单的扩展方式是增加神经网络的深度[9]。塞格迪等人 [10] 使用多分支架构引入深度 Inception 网络，其中每个分支都经过精心定制。并且已经开发了 Res NeXt [7]。 WideRes Net [6] 提出了一种具有更多卷积滤波器和降低深度的残差网络。 Pyramid Net [20] 是 Wide Res Net 的严格概括，其中网络的宽度逐渐增加。 Res NeXt [7] 建议使用分组卷积，并表明增加基数可以提高分类精度。最近，Huang 等人。 [21] 提出了一种新的架构，Dense Net。它迭代地将输入特征与输出特征连接起来，使每个卷积块能够接收来自所有先前块的原始信息。虽然最近的大多数网络工程方法主要针对三个因素深度 [19, 9, 10, 5]，宽度 [10

了解本专栏

超级会员免费看

这糖有点苦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
YOLOv5改进之Convolutional Block Attention Module

我们提出了卷积块注意模块(CBAM)，这是一种简单而有效的前馈卷积神经网络注意模块。给定一个中间特征映射，我们的模块沿着两个独立的维度依次推断注意力映射，通道和空间，然后将注意力映射乘以输入特征映射以进行自适应特征细化。因为CBAM是一个轻量级的通用模块，它可以无缝地集成到任何CNN架构中，开销可以忽略不计，并且可以与基础CNN一起进行端到端训练。我们通过在ImageNet-1K、MS COCO检测和VOC 2007检测数据集上进行大量实验来验证我们的CBAM。
复制链接

扫一扫