M-CenterNet:多中心点的CenterNet

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


导读

本文针对小目标检测,在CenterNet上进行了改进,将CenterNet上的一个中心点改成了4个中心点,取得了不错的效果,改动很小,但很有效。

后台回复:“mcenternet”获取论文下载链接

Tiny Object Detection in Aerial Images

摘要:我们基于CenterNet,提出了一种多中心点的网络(M-CenterNet),可以提升小目标的检测能力,并且实验表明,该方法能够明显提升小目标检测效果。

1. 介绍

本文在CenterNet的基础上进行了改进,我们为每个物体定位多个中心点,并预测多个offset和尺度,我们的实验表明,我们的方法可以有效提升AI-TOD数据集上的表现。

本文的贡献如下:

  • 我们介绍了AI-TOD,一个航拍小目标检测数据集,我们实验了当前的最先进的物体检测器在这个数据集上的表现。

  • 我们提出了多个中心点的物体检测方法,M-CenterNet,用来做小目标检测,在AI-TOD数据集上在AP和oLRP指标上都达到了最好的效果。

2. 数据集

每个类别的数量:AI-TOD数据集包括700,621个标注目标,8个类别。图2a显示了一些不常见的类别,数量相比于其他常见的类别会少很多,这种类别不均衡的现象在航拍图像中是很常见的,在真实世界中也是很重要的。

每张图的目标数:图2b中可见,每张图中的目标数,最大可到2667个,比其他常见的数据集中要多很多。

物体尺寸的分布:图2c中显示了尺寸分布的情况,大部分都是12个像素左右,见表2,均值和方差为12.8像素和5.9像素,比其他数据集中的尺寸要小很多。

e192ea6a88fa080d975d9072e3656263.png

物体尺寸的分类:我们把2~8像素的成为very tiny,8~16像素的为tiny,16 ~ 32像素的为small,32~64像素的为medium,没有大物体。比例分别为:13.3%,72.3%,12.3%,2.1%,具体见图2d。

b07ea55b3fc2f4c129576c290469f719.png

数据集中的一些样例图像如下:

2619ec682e96b79a595c45be6cee7fd7.png

3. 方法

检测小目标需要比较大的分辨率的特征图,关键点预测网络可以输出高质量的高分辨率的特征图。我们提出的M-CenteNet是在CenterNet的基础上的改进。为了可以达到较好的检测效果,需要预测高质量的包围框,这个包围框需要和GT具有很高的IoU,但是,IoU对于小目标是很敏感的。所以,准确的定位对于提升小目标的检测是很重要的。图3是原始的CenterNet,使用了一个中心点作为gt,红点是特征图上的真实中心点,蓝色点和灰色点在训练的时候被分别作为正样本和负样本。是对应正样本的offset。在这种设计中,最多可能会有4个像素的偏差,因此,预测框和GT的IoU可能会小于0.5,这个物体就会漏掉。

bb18b7bebe4288be2538780b105ddf84.png

为了解决这个问题,我们使用了多个中心的设计,如图3b所示,我们把4个蓝色点都作为正样本,这4个点分别为:

38e05d83858c6329da168a75beb746a0.png

对应的offset为:

1f3d31248afcca8c025133a7593e38c1.png

其余的地方和CenterNet保持一致。在推理阶段,我们使用2x2平均池化来找中心点,使用NMS来过滤冗余框。

4. 实验

在评估的时候,我们使用了2个指标,一个是AP,另一个是Optimal Localization Recall Precision (oLRP) ,可以更好的评估定位的能力。oLRP的计算方法如下:

30a69d1b5414bfc232ff240ae35488c3.png

其中:

0e959e55ffebbe6f3133102fee34d715.png

fa3eaa5372221e914e529cad39ff9f9e.png

其中,τ是IoU的阈值,,,分别表示TP,FP和FN的数量。。

需要注意的是,AP的指标是越高越好,而oLRP是个错误指标,越低越好。

表3和表4是基线模型的结果,可以看到,这些方面在AI-TOD上的结果要比COCO上差很多

08ac159d2f4f5fa56fa1a72c81c3b800.png

73b316cb0c3c3bdb11d5034305e798e2.png

总体来说,anchor free的方法要更好一些,因为这些方法并不使用IoU来分配正负样本,而小目标又对IoU非常的敏感。M-CenterNet取得了最好的结果。

fc1f7459690c620a48dbb0c88ea52c55.png

—END—

b285a1a8fefbe025f5096f85fb48a17f.png

请长按或扫描二维码关注本公众号

喜欢的话,请给我个在看吧

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值