中文标题:基于盒边界感知向量的航空图像定向目标检测
摘要
航拍图像中的定向物体检测是一项具有挑战性的任务,因为这些图像中的物体显示为任意方向,并且通常密集排列。当前的定向物体检测方法主要依赖于两阶段的基于锚框的检测器。然而,这些基于锚框的检测器通常会在正负锚框之间遭遇严重的不平衡问题。为了解决这个问题,在这项工作中,我们扩展了水平关键点检测器用于定向物体检测。具体而言,我们首先检测物体的中心关键点,然后基于这些关键点回归边界感知向量(BBAVectors)以捕捉定向边界框。这些边界感知向量分布在笛卡尔坐标系的四个象限内,用于所有任意定向的物体。为了减轻在角落情况中学习向量的难度,我们进一步将定向边界框分类为水平和旋转边界框。在实验中,我们表明学习边界感知向量优于直接预测定向边界框的宽度、高度和角度,如基线方法中采用的那样。此外,我们的方法与最先进的方法竞争时表现良好。代码可在https://github.com/yijingru/BBAVectors-Oriented-Object-Detection获取。
1. 引言
航拍图像中的物体检测是许多应用的基本步骤,例如城市规划、交通监控、港口管理和海上救援[1, 28]。航拍图像是从鸟瞰视角拍摄的。检测航拍图像中的物体是一项具有挑战性的任务,因为这些物体通常具有不同的尺度和纹理,并且背景复杂。此外,物体通常密集排列并显示为任意方向。因此,应用水平边界框进行定向物体检测将导致检测的边界框与物体之间的错位[2]。为了处理这个问题,定向边界框被用于捕捉航拍图像中的物体。
当前的定向物体检测方法