文章链接:
http://arxiv.org/abs/2008.07043
代码链接:
https://github.com/yijingru/BBAVectors-Oriented-Object-Detection
2.相关工作
2.1任意方向检测
作者指出,早先的目标检测方法大多使用水平检测框,比如R-CNN,fast R-CNN,faster R-CNN,SSD,YOLO等等。
多方向检测框依赖于水平检测框,是水平检测框的拓展:
R^2 CNN利用RPN(region proposal network):1.生成基于文本的水平检测框;2.基于不同尺度的池化ROI特征回归多方向检测框;
R^2 PN:1.将多方向检测框参数融入了RPN网络;2.提出了旋转的RPN网络,利用旋转的ROI池化来描述边界框;
R-DFPN:基于FPN,1.联合多规模特征,2.增强目标检测能力;
略过之后提到的几种方法,作者总结:所有依赖于水平检测框拓展出的多方向检测框都是基于锚点检测的方法:基于锚点的检测器首先密集地平铺很多锚点盒,之后回归目标盒和锚点盒之间的抵消量offset,这种基于锚点的策略受到正负锚点盒不平衡的影响,这种情况将会导致训练速度慢和检测性能下降。
2.2基于关键点的检测
无锚点检测方法主要包括基于关键点的检测,在水平目标检测任务中,基于关键点的检测方法主要用于检测角点或者检测中心点,并且提取出检测框的尺度信息;以下是例子:
角点网络是行业引领之一,他捕获热图中左上角和右下角的点,并且通过对比间距来分组角点;中略,这些方法检测方法都较慢;为了解决这个问题,周的中心网络提出根据中心点回归宽度和高度,加快了预测速度;
基于关键点的检测器展示了基于锚点检测在速度和精确度方面的优势,即使多方向目标检测任务很少用到基于中心点的检测;
这篇文章以周的中心目标检测网络为基线,特殊的是,本文第一次同时回归宽度w,高度h和角度θ。基线记为center+wh+θ,本文将把新提出的方法与center+wh+θ相比较来展示bbavector描述方法的优点;