FFCA-YOLO for small object detection in remote sensing images（遥感图像中的小物体检测FFCA-YOLO）

最新推荐文章于 2024-10-14 22:05:43 发布

萌新滴程序员

最新推荐文章于 2024-10-14 22:05:43 发布

阅读量1.1k

点赞数 13

文章标签：目标检测 YOLO 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w_gun/article/details/142055514

版权

文章的挑战：

特征表示不足和背景混淆。特别是当算法在船上进行实时处理时，需要在有限的计算资源条件下对精度和速度进行大量优化。

文章的内容：

本文提出了一种高效的检测器，成为特征增强、融合和上下文感知YOLO（FFCA-YOLO）（feature enhancement，fusion and context aware YOLO）。

FFCA-YOLO包含三个创新的轻型即插即用模块：

特征增强模块（FEM）、特征融合模块（FFM）、空间上下文感知模块（SCAM）

这三个模块分别提高了局部区域感知、多尺度特征融合以及跨通道和空间的全局关联等能力。

用于小物体检测的公开遥感数据集：VEDAI和AI-TOD。

一个自建的数据集（USOD）

为了确保效率进一步减少计算资源消耗，通过基于部分卷积（PConv）重构了FFCA-YOLO的backbone和neck。优化了FFCA-YOLO的精简版（L-FFCA-YOLO）

文章背景：

应用领域包括：交通监管、搜索和监控、救援、安全、军事等。

小目标：小于32*32像素。

遥感系统面临问题：观测条件不可控、成像链干扰多等问题（平台运动、大气和各种复杂的成像场景）=》这些因素都会导致物体和背景的混叠从而使小物体难以分辨。

另一方面。随着相机波段和分辨率的提高，机载成像过程中会产生大量数据。如WorldView-4每天采集数据覆盖680000平方公里。

传统的数据下行（词不错）后地面处理模式面临严峻挑战，难以满足军事侦查等要求。

机载实时处理可以缓解传输压力。ESA将机载处理技术作为重点研究方向。处理算法在可靠性、速度规模方面性能（词可以的）

总结：特征表示不足、背景混淆、在有限的硬件条件下优化速度和精度。

缓解特征表示不足和背景混淆问题的关键在于特征增强和融合。

在特征增强方面，充分利用局部和全局上下文信息可以有效增强网络对小物体的感知。

提出了特征增强模块（FEM）和空间上下文感知模块（SCAM），分别用于丰富局部和全局上下文特征。

FEM：通过multibranch atrous convolution（多分支空洞卷积）扩展backbone的感受野。

SCAM：通过构建全局上下文关系来考虑小对象与全局区域之间的关联。

FFM：在特征融合方面，通过通道信息对不同的特征图进行重新加权。

基于部分卷积（PConv）重构FFCA-YOLO的backbone和neck

文章Related Work：

A、YOLO在遥感的应用：

TPH-YOLO：将transformer编码器模块集成到backbone中，以获取丰富的全局上下文信息，提高物体特征表示的质量。

FE-YOLO：在YOLO的neck中使用可变形卷积进行高低特征图的特征融合，消除自上而下的连接对物体造成的寓意空白影响。

CA-YOLO：将坐标注意力模块嵌入浅层网络提取中，通过建立像素之间的长距离依赖关系，抑制冗余背景，增强物体的特征表示。

B、小物体检测的特征增强和融合方法

特征金字塔（FPN）：将高分辨率的低层次特征与低分辨率的高层次特征聚合在一起。

PANet、NAS-FPN、ASFF、BiFPN

AugFPN：解决特征图中细节信息与语义信息不一致的问题。

HRDNet：使用多深度图像金字塔结合多尺度FPN深化特征。

融合前的特征增强可以进一步改善网络的语义表征。

双重注意力机制在融合前增强特征，使网络关注对象的明显特征。

利用空间和通道维度的注意力机制来增强特征。

通过多分支卷积和transformer扩大感受野也可以增强特征。

FEM：包括一个标准卷积和一个非线性卷积的多分支结构。

C、全局上下文特征表示：

全局感受野和上下午信息对于小目标定位非常重要。

NLNet：通过计算空间像素之间的成对相关性来聚合全局上下文。

GCNet和SCP简化了Q和K的乘法解决了NLNet计算量过大的问题。

SCP：为GCNet增加了额外的路径来学习每个像素的信息，附加路径使用一个1*1卷积来聚合不同通道之间的空间信息。

本文（SCAM）：SCAM使用全局平均池化（GAP）和全局最大池化（GMP）指导像素学习空间和通道之间的关系。

D、轻量级模型框架：

轻量化是衡量探测器性能的一个重要指标，尤其是针对未来的机载部署，要求在有限的计算资源下优化精度和速度。

第一种：以剪枝为代表的模型压缩。剪枝的本质是删除低于设计过滤算法所设定阈值的冗余参数。

第二种使用轻量级卷积网络来优化模型结构：

MobileNet、ShuffleNet、GhostNet使用深度卷积（DWConv）和组卷积来提取空间信息。

DWConv可以有效减少参数数量和FLOPS。

DWConv FLOPS低的主要原因是运算器频繁访问内存。

本文（PConv）：通过减少冗余计算和内存访问，更有效的提取空间特征。

萌新滴程序员

关注

13
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。