FFCA-YOLO for small object detection in remote sensing images(遥感图像中的小物体检测FFCA-YOLO)

文章的挑战:

特征表示不足和背景混淆。特别是当算法在船上进行实时处理时,需要在有限的计算资源条件下对精度和速度进行大量优化。

文章的内容:

本文提出了一种高效的检测器,成为特征增强、融合和上下文感知YOLO(FFCA-YOLO)(feature enhancement,fusion and context aware YOLO)。

FFCA-YOLO包含三个创新的轻型即插即用模块:

特征增强模块(FEM)、特征融合模块(FFM)、空间上下文感知模块(SCAM)

这三个模块分别提高了局部区域感知、多尺度特征融合以及跨通道和空间的全局关联等能力。

用于小物体检测的公开遥感数据集:VEDAI和AI-TOD。

一个自建的数据集(USOD)

为了确保效率进一步减少计算资源消耗,通过基于部分卷积(PConv)重构了FFCA-YOLO的backbone和neck。优化了FFCA-YOLO的精简版(L-FFCA-YOLO)

文章背景:

应用领域包括:交通监管、搜索和监控、救援、安全、军事等。

小目标:小于32*32像素。

遥感系统面临问题:观测条件不可控、成像链干扰多等问题(平台运动、大气和各种复杂的成像场景)=》这些因素都会导致物体和背景的混叠从而使小物体难以分辨。

另一方面。随着相机波段和分辨率的提高,机载成像过程中会产生大量数据。如WorldView-4每天采集数据覆盖680000平方公里。

传统的数据下行(词不错)后地面处理模式面临严峻挑战,难以满足军事侦查等要求。

机载实时处理可以缓解传输压力。ESA将机载处理技术作为重点研究方向。处理算法在可靠性、速度规模方面性能(词可以的)

总结:特征表示不足、背景混淆、在有限的硬件条件下优化速度和精度。

缓解特征表示不足和背景混淆问题的关键在于特征增强和融合。

在特征增强方面,充分利用局部和全局上下文信息可以有效增强网络对小物体的感知。

提出了特征增强模块(FEM)和空间上下文感知模块(SCAM),分别用于丰富局部和全局上下文特征。

FEM:通过multibranch atrous convolution(多分支空洞卷积)扩展backbone的感受野。

SCAM:通过构建全局上下文关系来考虑小对象与全局区域之间的关联。

FFM:在特征融合方面,通过通道信息对不同的特征图进行重新加权。

基于部分卷积(PConv)重构FFCA-YOLO的backbone和neck

文章Related Work

A、YOLO在遥感的应用:

TPH-YOLO:将transformer编码器模块集成到backbone中,以获取丰富的全局上下文信息,提高物体特征表示的质量。

FE-YOLO:在YOLO的neck中使用可变形卷积进行高低特征图的特征融合,消除自上而下的连接对物体造成的寓意空白影响。

CA-YOLO:将坐标注意力模块嵌入浅层网络提取中,通过建立像素之间的长距离依赖关系,抑制冗余背景,增强物体的特征表示。

B、小物体检测的特征增强和融合方法

特征金字塔(FPN):将高分辨率的低层次特征与低分辨率的高层次特征聚合在一起。

PANet、NAS-FPN、ASFF、BiFPN

AugFPN:解决特征图中细节信息与语义信息不一致的问题。

HRDNet:使用多深度图像金字塔结合多尺度FPN深化特征。

融合前的特征增强可以进一步改善网络的语义表征。

双重注意力机制在融合前增强特征,使网络关注对象的明显特征。

利用空间和通道维度的注意力机制来增强特征。

通过多分支卷积和transformer扩大感受野也可以增强特征。

FEM:包括一个标准卷积和一个非线性卷积的多分支结构。

C、全局上下文特征表示:

全局感受野和上下午信息对于小目标定位非常重要。

NLNet:通过计算空间像素之间的成对相关性来聚合全局上下文。

GCNet和SCP简化了Q和K的乘法解决了NLNet计算量过大的问题。

SCP:为GCNet增加了额外的路径来学习每个像素的信息,附加路径使用一个1*1卷积来聚合不同通道之间的空间信息。

本文(SCAM):SCAM使用全局平均池化(GAP)和全局最大池化(GMP)指导像素学习空间和通道之间的关系。

D、轻量级模型框架:

轻量化是衡量探测器性能的一个重要指标,尤其是针对未来的机载部署,要求在有限的计算资源下优化精度和速度。

第一种:以剪枝为代表的模型压缩。剪枝的本质是删除低于设计过滤算法所设定阈值的冗余参数。

第二种使用轻量级卷积网络来优化模型结构:

MobileNet、ShuffleNet、GhostNet使用深度卷积(DWConv)和组卷积来提取空间信息。

DWConv可以有效减少参数数量和FLOPS。

DWConv FLOPS低的主要原因是运算器频繁访问内存。

本文(PConv):通过减少冗余计算和内存访问,更有效的提取空间特征。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值