【目标检测】AGMF-Net:遥感目标检测的无注意力全局多尺度融合网络

《Attention-Free Global Multiscale Fusion Network for Remote Sensing Object Detection》
遥感目标检测的无注意力全局多尺度融合网络
原文:https://ieeexplore.ieee.org/document/10371366

摘要

遥感目标检测(RSOD)在复杂背景和小目标探测中面临挑战,它们相互关联,无法单独解决。为此,我们提出了一种无注意的全局多尺度融合网络(AGMF-Net)。最初,我们提出了一个空间偏差模块(SBM)来获得长期依赖关系,作为我们提出的全局信息提取模块(GIEM)的一部分。GIEM有效地捕捉了全球信息,克服了复杂背景所带来的挑战。此外,我们提出了多任务增强结构(MES)和多任务特征预处理(MFP)来增强多尺度目标的特征表示,同时消除了来自复杂背景的干扰。此外,本文还提出了一种有效的上下文解耦检测器(ECDD),为回归和分类任务提供了独特的特征,旨在提高RSOD的效率。大量的实验表明,我们提出的方法与最先进的探测器相比,取得了优越的性能。其中,AGMF-Net在光学遥感图像(DIOR)、高分辨率遥感检测(HRRSD)、西北理工大学极高分辨率-10(NWPU VHR-10)和RSOD数据集上的平均检测精度分别为73.2%、92.03%、95.21%和94.30%。

网络结构

在这里插入图片描述

GIEM(全局信息提取模块)

特征提取骨干网络由四个GIEM模块组成,能够从不同的深度提取全局语义信息。
GIEM模块结构:由多个空间偏差模块(SBM)组成,SBM将空间偏差图与卷积特征图相结合。这使得网络能够将来自空间偏差的全局知识与来自卷积特征图的局部特征结合起来,使其能够同时学习局部信息和全局信息。空间偏差捕获了更广泛的区域,而卷积特征聚焦于图像中的局部细节。

MES(多任务增强结构)

多尺度特征融合:通过 MFP(多任务特征预处理)模块和 GIEM 来增强特征表示,减少噪声干扰,为分类和定位任务提供融合的语义强特征和高分辨率特征图。
特征预处理:MFP 模块通过聚合信息(Q、K、V)来获得多尺度特征图,并使用 SBM 进行全局注意力提取,最后融合不同尺度的特征。

MSE

在这里插入图片描述

MFP

在这里插入图片描述

高效上下文解耦头(ECDD)

结构:通过 SBM 和 1×1 卷积层将输入预测特征图解耦为两个分支,分别用于分类和回归任务。
损失函数:使用变量焦点损失(VFL)来实现正负样本的不对称加权,强调正样本;使用完整交并比(CIOU)损失函数来考虑边界框的纵横比;引入距离焦点损失(DFL)函数来快速聚焦网络到目标附近的位置。
在这里插入图片描述

实验

不同数据集不同模块引入实验

baseline:DarkNet53
在这里插入图片描述

不同数据集和其他模型对比实验

在这里插入图片描述

代表性检测结果

在这里插入图片描述

RSOD数据集对比网络实验

在这里插入图片描述

不同模块可视化提取效果

在这里插入图片描述

  • 12
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值