SARDet-100K-面向大规模 SAR 物体检测的开源基准和工具包

目录

SARDet-100K

基本特点

论文提要

摘要

本文的贡献

SARDet_100K数据集

MSFA (Multi-Stage with Filter Augmentation Pretraining Framework)——滤波增强的多阶段预训练框架

滤波增强输入

多级预训练框架

MSFA

实验分析

 局限性

杂谈

参考文献


SARDet-100K

文献来源:  论文地址  仓库地址:github.com/zcablii/SARDet_100K

作者:李宇轩,李翔*,李玮杰,侯淇彬,刘丽,程明明,杨健*

2D Object Detection on SARDet-100K(SOTA榜)

数据集下载链接(密码:SARD)

基本特点

  • 融合了一共十种开源可用的高质量数据集,并按照8:1:1的比例划分训练集,验证集,测试集。
  • 保安一共116598张图片和245653个实例,包含飞机,船舶,港口,汽车,桥梁,坦克一共六个类别。
  • 将各种类型的数据集统一重新切片并且转换注释格式为COCO格式。

论文提要

摘要

合成孔径雷达(SAR)目标检测因其不可替代的全天候成像能力近年来受到广泛关注。 然而,该研究领域面临着有限的公共数据集和无法访问的源代码。 为了应对这些挑战,该团队建立了一个新的基准数据集和一种用于大规模 SAR 物体检测的开源方法。 该团队的数据集 SARDet-100K 是对 10 个现有 SAR 检测数据集进行大量调查、收集和标准化的结果,为研究目的提供了大规模且多样化的数据集。该团队基于该数据集进行了全面的实验,发现了 SAR 目标检测的一个关键挑战:RGB 数据集的预训练和 SAR 数据集的微调在数据域和模型结构方面存在巨大差异。 为了弥补这些差距,该团队提出了一种新颖的多阶段过滤器增强(MSFA)预训练框架,该框架从数据输入、域转换和模型迁移的角度解决了问题。 所提出的 MSFA 方法显着增强了 SAR 目标检测模型的性能,同时在不同模型中展示了卓越的通用性和灵活性。 

本文的贡献
  • 引入第一个用于 SAR 多类别目标检测的 COCO 级大规模数据集。
  • 发现了 SAR 目标检测传统模型预训练和微调方法中的关键差距。
  • 提出了带有滤波器增强(MSFA)的多阶段预训练框架,该框架在各种深度网络模型中表现出显着的有效性以及出色的通用性和灵活性。
  • 通过发布与我们研究相关的数据集和代码,建立 SAR 物体检测的新基准。 
SARDet_100K数据集

目前现存的SAR数据集相对有限,低分辨率的数据集往往局限于宏观视图上的场景分类,高分辨率 的数据集虽能更好描述例如船,车这类的小目标,但是获取条件苛刻,且往往缺乏多样性(例如波段,偏振,分辨率等方面)。

而该团队提出的SARDet_100K融合的十种数据集不仅各类参数多样化,没有冲突的对象类别,数据来源也不同。下图为数据集预览:

数据集相关信息如下:

下图数据集标准化流程,包括了数据集划分,大图像切片和标签注释格式统一。

(下面为笔者仅针对训练集进行的简单数据分析,可能有所偏差,仅供参考。)

MSFA (Multi-Stage with Filter Augmentation Pretraining Framework)——滤波增强的多阶段预训练框架

最近的研究主要依赖于默认的ImageNet预训练方法提出网络设计等提高SAR目标检测的性能,而忽略了从用于预训练的自然数据集和用于微调的SAR数据集之间的显著域差异,以及主干网络和整个检测框架之间的模型差异。

该团队提出的MSFA预训练框架则从数据输入,域转换以及模型迁移三个角度解决这些问题。MSFA包含两个核心设计:

  • 滤波增强输入
  • 多级预训练框架
滤波增强输入

本文采用一些手工制作的滤波算子,例如HOG,Canny,Haar,WST,GRE等,将原本输入与相应滤波变换后的数据串联作为新的输入。这样通过把数据从像素空间投射到滤波增强特征空间,从而显著减少自然RGB图像和SAR图像之间的域差异。如下图4(a)所示:

多级预训练框架

在传统的预训练模式中:

预训练阶段首先在 ImageNet(IN)数据集上随机初始化并训练骨干网络 B_\theta,然后在 SAR 数据集上使用预训练好的的检测模型 A_B 进行微调。如下列公式:

\label {eqn:2} B = \text {Train}_{cls}(B_{\theta })(D_{IN}) \text {,}

\label {eqn:3} A = \text {Train}_{det}(A_B)(D_{SAR}) \text {.}

本文提出的方法相当于是在第一步完成后添加了一步:用大规模遥感数据集D_{RS}作为域迁移的检测预训练,该数据集域下游SAR数据集也有着相似的对象形状,大小。如上图图4(b)所示,这种方式在自然RGB图像在ImageNet上的光学分别和SAR上的目标分布间搭起了一座桥梁。

公式也变成了:

\label {eqn:2} B = \text {Train}_{cls}(B_{\theta })(D_{IN}) \text {,}

\label {eqn:5} A' = \text {Train}_{det}(A_B)(D_{RS}) \text {,}

\label {eqn:6} A = \text {Train}_{det}(A_{A'})(D_{SAR}) \text {.}

MSFA

MSFA融合以上两者后的框架与传统方法的框架对比如下所示:

实验分析

下图主要是添加不同滤波增强输入算子后的mAP比较以及ImageNet 和 SARDet-100k 在 RGB 和手工特征空间上的皮尔逊相关系数 (PCC)。

可以发现:自然图像与SAR图像之间的域差异较大,但是经过滤波增强后的图像域差异显著减小。

可以看出WST不仅缩小域差异的特点以及提取多尺度信息的能力产生了出色的性能,也能看出单纯算子的叠加并不能提供实质有效的额外信息。

上图为不同预训练策略的效果显示。

为了对其有效性和普遍性进行评估,该团队使用各种检测器和骨干网络上进行了丰富的实验,如下图所示,验证了该方法具有相当广泛的适用性和显著的有效性。

 最后是MSFA与以前的SOTA方法比对。如下图所示,该文提出的方法明显优于之前所有的方法,在SSDD数据集的mAP@50指标达到了97.9%,在HRSID上达到了83.7%

 局限性
  1. 考虑到存在大量无注释的SAR数据集(例如最经典的MSTAR,FARAD等等),可以尝试探索半监督,弱监督或者无监督的方法。
  2. 本文的设计方向偏向简单实用,通用性高,但未深入讨论设计细节。可以尝试引入更复杂专业的设计提高性能。

杂谈

目前有关SAR图像目标检测的大型数据集实在是少之又少,该团队所搭建的这一数据集——SARDet 100K确实是第一个大规模 SAR 物体检测数据集,其大小甚至可以与广泛使用的 COCO数据集(118K张 图像)相当,解决该领域了缺少数据集的痛点。该团队在主要工作包括:提出了一种新的SAR目标检测数据集基准;在数据输入上采用手工特征描述算子WST等;在域转换上采用了一种分层预训练方法等。

参考文献

[1] Li, Yuxuan, Xiang Li, Weijie Li, Qibin Hou, Li Liu, Ming-Ming Cheng, and Jian Yang. "SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection." arXiv preprint arXiv:2403.06534, 2024.

[2] Deng, Jia, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. "Imagenet: A large-scale hierarchical image database." In CVPR, 2009.

[3] Lin, Tsung-Yi, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. "Microsoft coco: Common objects in context." In ECCV, 2014.

[4] Xia, G.S., Bai, X., Ding, J., Zhu, Z., Belongie, S., Luo, J., Datcu, M., Pelillo, M.Zhang, L.: DOTA: A large-scale dataset for object detection in aerial images. In CVPR, 2018.

如果觉得文章不错,欢迎点赞收藏评论交流,这也是不断更新的动力!

  • 37
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值