YOLOv5改进之Convolutional Block Attention Module

本文介绍了将卷积块注意模块(CBAM)应用于YOLOv5的实践,通过CBAM在通道和空间维度上增强特征表示。在ImageNet-1K、MS COCO和VOC 2007数据集上的实验表明,CBAM能有效提升模型性能。在YOLOv5中,CBAM被添加到backbone和neck部分,通过修改yaml配置文件和yolo.py文件完成集成。
摘要由CSDN通过智能技术生成

目录

一、CBAM理论部分

相关工作

网络结构

二、YOLOv5中的应用

代码

添加到YOLOv5中

backbone

neck

common.py和yolo.py文件配置


一、CBAM理论部分

      我们提出了卷积块注意模块(CBAM),这是一种简单而有效的前馈卷积神经网络注意模块。给定一个中间特征映射,我们的模块沿着两个独立的维度依次推断注意力映射,通道和空间,然后将注意力映射乘以输入特征映射以进行自适应特征细化。因为CBAM是一个轻量级的通用模块,它可以无缝地集成到任何CNN架构中,开销可以忽略不计,并且可以与基础CNN一起进行端到端训练。我们通过在ImageNet-1K、MS COCO检测和VOC 2007检测数据集上进行大量实验来验证我们的CBAM。

相关工作

网络工程:“网络工程”一直是最重要的视觉研究之一,因为精心设计的网络可确保在各种应用中显着提升性能。自大规模 CNN [19] 成功实施以来,已经提出了广泛的架构。一种直观且简单的扩展方式是增加神经网络的深度[9]。塞格迪等人 [10] 使用多分支架构引入深度 Inception 网络,其中每个分支都经过精心定制。并且已经开发了 Res NeXt [7]。 WideRes Net [6] 提出了一种具有更多卷积滤波器和降低深度的残差网络。 Pyramid Net [20] 是 Wide Res Net 的严格概括,其中网络的宽度逐渐增加。 Res NeXt [7] 建议使用分组卷积,并表明增加基数可以提高分类精度。最近,Huang 等人。 [21] 提出了一种新的架构,Dense Net。它迭代地将输入特征与输出特征连接起来,使每个卷积块能够接收来自所有先前块的原始信息。虽然最近的大多数网络工程方法主要针对三个因素深度 [19, 9, 10, 5],宽度 [10

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

这糖有点苦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值