文章的挑战:
特征表示不足和背景混淆。特别是当算法在船上进行实时处理时,需要在有限的计算资源条件下对精度和速度进行大量优化。
文章的内容:
本文提出了一种高效的检测器,成为特征增强、融合和上下文感知YOLO(FFCA-YOLO)(feature enhancement,fusion and context aware YOLO)。
FFCA-YOLO包含三个创新的轻型即插即用模块:
特征增强模块(FEM)、特征融合模块(FFM)、空间上下文感知模块(SCAM)
这三个模块分别提高了局部区域感知、多尺度特征融合以及跨通道和空间的全局关联等能力。
用于小物体检测的公开遥感数据集:VEDAI和AI-TOD。
一个自建的数据集(USOD)
为了确保效率进一步减少计算资源消耗,通过基于部分卷积(PConv)重构了FFCA-YOLO的backbone和neck。优化了FFCA-YOLO的精简版(L-FFCA-YOLO)
文章背景:
应用领域包括:交通监管、搜索和监控、救援、安全、军事等。
小目标:小于32*32像素。
遥感系统面临问题:观测条件不可控、成像链干扰多等问题(平台运动、大气和各种复杂的成像场景)=》这些因素都会导致物体和背景的混叠从而使小物体难以分辨。
另一方面。随着相机波段和分辨率的提高,机载成像过程中会产生大量数据。如WorldView-4每天采集数据覆盖680000平方公里。
传统的数据下行(词不错)后地面处理模式面临严峻挑战,难以满足军事侦查等要求。
机载实时处理可以缓解传输压力。ESA将机载处理技术作为重点研究方向。处理算法在可靠性、速度规模方面性能(词可以的)
总结:特征表示不足、背景混淆、在有限的硬件条件下优化速度和精度。
缓解特征表示不足和背景混淆问题的关键在于特征增强和融合。
在特征增强方面,充分利用局部和全局上下文信息可以有效增强网络对小物体的感知。
提出了特征增强模块(FEM)和空间上下文感知模块(SCAM),分别用于丰富局部和全局上下文特征。
FEM:通过multibranch atrous convolution(多分支空洞卷积)扩展backbone的感受野。
SCAM:通过构建全局上下文关系来考虑小对象与全局区域之间的关联。
FFM:在特征融合方面,通过通道信息对不同的特征图进行重新加权。
基于部分卷积(PConv)重构FFCA-YOLO的backbone和neck
文章Related Work:
A、YOLO在遥感的应用:
TPH-YOLO:将transformer编码器模块集成到backbone中,以获取丰富的全局上下文信息,提高物体特征表示的质量。
FE-YOLO:在YOLO的neck中使用可变形卷积进行高低特征图的特征融合,消除自上而下的连接对物体造成的寓意空白影响。
CA-YOLO:将坐标注意力模块嵌入浅层网络提取中,通过建立像素之间的长距离依赖关系,抑制冗余背景,增强物体的特征表示。
B、小物体检测的特征增强和融合方法
特征金字塔(FPN):将高分辨率的低层次特征与低分辨率的高层次特征聚合在一起。
PANet、NAS-FPN、ASFF、BiFPN
AugFPN:解决特征图中细节信息与语义信息不一致的问题。
HRDNet:使用多深度图像金字塔结合多尺度FPN深化特征。
融合前的特征增强可以进一步改善网络的语义表征。
双重注意力机制在融合前增强特征,使网络关注对象的明显特征。
利用空间和通道维度的注意力机制来增强特征。
通过多分支卷积和transformer扩大感受野也可以增强特征。
FEM:包括一个标准卷积和一个非线性卷积的多分支结构。
C、全局上下文特征表示:
全局感受野和上下午信息对于小目标定位非常重要。
NLNet:通过计算空间像素之间的成对相关性来聚合全局上下文。
GCNet和SCP简化了Q和K的乘法解决了NLNet计算量过大的问题。
SCP:为GCNet增加了额外的路径来学习每个像素的信息,附加路径使用一个1*1卷积来聚合不同通道之间的空间信息。
本文(SCAM):SCAM使用全局平均池化(GAP)和全局最大池化(GMP)指导像素学习空间和通道之间的关系。
D、轻量级模型框架:
轻量化是衡量探测器性能的一个重要指标,尤其是针对未来的机载部署,要求在有限的计算资源下优化精度和速度。
第一种:以剪枝为代表的模型压缩。剪枝的本质是删除低于设计过滤算法所设定阈值的冗余参数。
第二种使用轻量级卷积网络来优化模型结构:
MobileNet、ShuffleNet、GhostNet使用深度卷积(DWConv)和组卷积来提取空间信息。
DWConv可以有效减少参数数量和FLOPS。
DWConv FLOPS低的主要原因是运算器频繁访问内存。
本文(PConv):通过减少冗余计算和内存访问,更有效的提取空间特征。