CV——day82 读论文:遥感目标检测的改进注意力特征融合SSD (AF-SSD)方法

文章提出了一种名为AF-SSD的方法,通过特征融合模块FFM、双路径注意模块DAM和多尺度接受域MRF改进了遥感目标检测。FFM引入语义信息,DAM抑制背景噪声,MRF捕捉多尺度特征,以提升小目标检测性能。实验在DOTA和NWPUVHR-10数据集上验证了方法的有效性。
摘要由CSDN通过智能技术生成

Attention and Feature Fusion SSD for Remote Sensing Object Detection

为了进一步提高单阶段方法的遥感目标检测性能,本文提出了一种名为注意力特征融合SSD (attention and feature fusion SSD)的端到端网络。

指标项:卷积神经网络,双路径注意机制,特征融合,图像处理,目标检测,遥感。

I. INTRODUCTION

遥感图像与自然场景图像在拍摄角度、目标分布、成像范围等方面存在不同,这使得遥感目标的检测仍然存在困难,具体表现在:

  1. 大宽高比,类间相似度高:航空图像的宽高比大,类间相似度高。

  2. 分布密集、物体小:物体在某些区域分布密集,以小物体为主。

  3. 复杂背景:遥感图像背景比较复杂,有些物体与背景相差不大。

为了解决上述问题,本文提出了一种改进的注意力特征融合SSD (AF-SSD)方法。

首先,设计了自顶向下多层特征融合模块(FFM),将语义信息引入浅层特征映射;

然后,引入双路径注意模块(DAM)对特征信息进行筛选。该模块利用空间注意和通道注意抑制背景噪声并突出关键特征。

然后,设计了多尺度感受域(MRF)模块,通过添加多个并行分支从不同尺度的感受域提取特征;

最后,优化损失函数,缓解正负样本之间的不平衡和分类难度。

II. RELATED WORK

B. 特征融合

虽然现有的目标检测算法在自然场景下性能良好,但对于小目标检测效果并不理想,尤其是单阶段检测方法。特征融合是解决这一问题的有效策略之一。

Lin et al. 以自底向上和自顶向下的方式集成多尺度特征,丰富上下文信息来改进模型。

Caoet al. 设计了两种不同的特征融合结构,并使用较高层次的特征映射来丰富浅层的语义信息。

DSSD 采用反卷积层和跳过连接引入了额外的大规模上下文信息,提高了平均精度(AP),特别是对于小对象。

C.注意力机制

在图像识别、语义分割、目标检测等计算机视觉任务中,可以利用注意机制增强关键特征,抑制无用特征,提高准确率。

空间注意和通道注意是深度学习模型中常用的两种方法。

STN 设计了一个空间变换模块,实现了图像的空间变换。

Hu 等在其挤压激励模型中引入注意信息和全局汇聚,利用信道间信息,增强了网络的鲁棒性。

Wang 等人设计了一个编码器-解码器模块,并在其上构建了残差注意网络。

实验结果表明,通过细化特征图,可以获得更好的输出结果。

III. PROPOSED METHOD

MRF: multiscale receptive field - 多尺度感受野

DAM: dualpath attention module - 双路径注意模块

FFM: feature fusion module - 特征融合模块

image-20230304234602885

如图1所示,AF-SSD采用ResNet-50作为骨干进行特征提取,因为其结构轻量化可以缩短训练时间。三个模块分别是:特征融合、双路径注意和MRF。此外,我们在额外的特性层之前添加了一个MRF结构。

A. 特性融合模块——FFM

对于小对象,SSD主要使用浅层特征进行预测。但是,由于SSD的层数较浅,缺乏语义信息,因此对小对象的性能较差。因此,为了充分利用语义信息和纹理特征,设计了一种自顶向下的FFM,将语义信息引入到浅层。

image-20230304235254738

如图2所示,FFM 由1 × 1卷积和双线性插值上采样组成。特征融合的过程如下:

首先,通过反卷积运算对深度特征FB进行上采样,以降低计算量;

然后,使用1 × 1卷积层对feature map的通道进行压缩;

最后,利用元素和对深度特征和浅层特征进行积分。

经过上述处理后,融合特征的通道保持不变,但单个通道的语义信息更丰富。后续实验表明,这些步骤丰富了浅层特征的语义信息,提高了模型在小对象上的性能。

为了平衡精度和速度,FFM 分别嵌入到Res3d和Res5c分支中。

B.双路径注意模块——DAM

由于feature map会被几个卷积层不断压缩,小物体的信息在深层会减少,背景噪声也会掩盖它。因此,有必要抑制非对象信息。DAM基于SE-Net模块。

image-20230304235217190

DAM由两个平行的分支——空间注意分支和通道注意分支组成。利用空间注意分支保留空间信息,利用通道注意分支抑制无用信息。我们通过重新衡量输入特征图和注意图来获得精细化的地图。这样,关键特征将被突出显示,来自输入的背景噪声也将被抑制。精细映射 f 计算为image-20230305000059236

⊗表示元素乘法,FS为空间注意图,FC为通道注意图。在乘法之前,两个分支输出都被调整为RH×W×C。

空间注意图计算为:image-20230305000207962

通道注意图计算为:

C. 多尺度接受域——MRF

我们都知道,CNN的接受域是指feature map上的像素在原始图像上所映射的区域的大小。接受域越大,特征图中包含的全局信息就越多。接受域越小,特征图中的信息就越详细。接收域也是影响检测性能的因素之一。

image-20230304235240514

如图4所示,MRF通过设置不同大小的并行卷积来捕获更多的多尺度特征。

MRF由4个分支组成,分别采用1 × 1 卷积、3 × 3 卷积、5 × 5 卷积、7 ×7 卷积和平均池化拓宽接受域。同时,我们使用1×1 卷积压缩信道。此外,我们将k × k变换分解为1 × k变换和k × 1变换。这样既保持了接受野的大小不变,又缩短了AF-SSD的推理时间

  • MRF模块可以有效增强AD-SSD的浅层特征,用于小目标的检测。

IV. EXPERIMENTS

A. Data Sets and Training

数据集:我们认为一个好的遥感数据集应该具有四个特点:数据量大,每类实例数量合理,面向对象的标注正确,不同类型的对象多,这样比较接近实际应用。

DOTA数据集:是一种用于目标检测的公开可用的光学遥感数据集。它包含15类总计188282个来自不同传感器和平台的实例,主要来自谷歌地球,还有一小部分来自JL-1卫星和GF-2卫星。

NWPU VHR-10:也是西北工业大学公布的公共遥感数据集。它包含了800张高分辨率的卫星图像,这些图像是从谷歌Earth和Vaihingen数据集剪辑而来的,其中650张是正图像集,其余的是负图像集。它包含10个类别,总计3651个实例。

V. CONCLUSION

本文提出了一种单阶段遥感目标探测模型,我们称之为AF-SSD。为了解决物体小、背景复杂和尺度变化带来的问题,我们首先引入自顶向下的FFM融合浅层和上层的特征。然后,引入一个DAM来抑制背景噪声。然后,设计了一个MRF模块来扩大接收域和捕获多尺度特征。此外,我们对损失函数进行了改进,以缓解正、负样本之间的不平衡。在DOTA和NWPU VHR-10上的实验结果表明,该方法对航拍图像中的小目标具有较好的检测效果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值