《Density Map Guided Object Detection in Aerial Images》
原文链接:https://arxiv.org/pdf/2004.05520.pdf
代码链接:https://github.com/Cli98/DMNet
一、针对什么问题?
1、问题:
航拍数据集VisDrone数据集中的难点:
1)目标尺寸变化较大;
2)目标分布不均匀;
其中VisDrone数据集特点:
a)视角,尺度变化
b)类别不平衡
c)遮挡和截断
d)小目标
二、 提出什么方法?
提出DMNet网络
1)生成密度图
a)改进版MCNN:一方面采用三种尺度MCNN来适应航空图像的大中小三种尺度;另一方面直接对密度图采用三次插值统一尺度,相较于上采样特征图,精度相近,内存更少。
b)密度图Groudtruth:geometry-adaptive and geometry-fixed kernel两种方法。文中选取了geometry-fixed kernel方法,并针对航空图像类别多样,尺度不一致且目标间距不均匀的问题,提出了class-wise kernel。即每一类给出一个类别。
2)基于密度图的裁剪
a)密度掩膜图生成:在密度图上采用滑动窗口对像素值统计,满足阈值区域置为1,反之为0。其中滑动窗口由训练集目标大小平均尺度得出,滑动过程中不重叠。
b)基于密度掩膜图生成裁剪区域:对值为1的离散区域采用8连通域算法连接起来,然后去获取合并区域的外接矩形作为最终裁剪区域。
3)裁剪图像检测
将裁剪区域和原图像的检测结果利用NMS进行融合,但需要注意的是,文中并不去除任何原图像的检测结果。
。