YOLOv10改进 | 注意力篇 | YOLOv10引入SpatialGroupEnhance注意力机制,并构建C2f_SGE

1. SGE介绍

1.1  摘要:卷积神经网络(CNN)通过收集语义子特征的层次和不同部分来生成复杂对象的特征表示。这些子特征通常可以以分组的形式分布在每层的特征向量中[43,32],代表各种语义实体。然而,这些子特征的激活通常在空间上受到相似模式和噪声背景的影响,从而导致错误的定位和识别。我们提出了一个空间分组增强(SGE)模块,可以通过为每个语义组中的每个空间位置生成注意力因子来调整每个子特征的重要性,以便每个单独的组可以自主增强其学习表达并抑制可能的噪声。注意因子仅由每个组内的全局和局部特征描述符之间的相似性指导,因此SGE模块的设计非常轻量级,几乎没有额外的参数和计算。尽管只使用类别监督进行训练,但SGE组件在突出显示具有各种高阶语义的多个活动区域(例如狗的眼睛,鼻子等)方面非常有效。当与流行的CNN骨干集成时,SGE可以显着提高图像识别任务的性能。具体来说,基于ResNet 50主干,SGE在ImageNet基准测试中实现了1.2%的Top-1精度提升,在COCO基准测试中实现了1.0 ~ 2.0%的AP增益,覆盖了各种检测器(Faster/Mask/Cascade RCNN和RetinaNet)。

官方论文地址:https://arxiv.org/pdf/1905.09646

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值