Gaussian YOLOv3
【ICCV2019】Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving
Abstract
FP(false positive)对无人驾驶会造成严重的后果,比如会造成不必要的刹车,这样会造成驾驶的不稳定性,本文通过在检测阶段使用the predicted localization
减少FP,增加TP,从而提高准确度。
数据集:KITTI & BDD
(Berkeley deep drive)
Introduction
无人驾驶目标检测算法应满足两点要求:
- 对于道路目标,例如车、行人、交通灯、交通标志等,具有高检测准确度。
- 实时的检测速度
问题:大多数算法尽管知道被检测物体的坐标,但是该bbox的结果的不确定性未知,结合不确定性
对于降低FP非常重要。
基础:YOLOv3实时,非常适合无人驾驶,但相较于两阶段检测器准确率低。
改进:
- 对YOLOv3的bbox坐标进行建模,只输出确定性值作为高斯参数(均值和方差)
- 重新设计了损失函数
Background
主要是对YOLO系列进行描述
Gaussian YOLOv3
Gaussian modeling
出发点:
- 对于目标检测中的分类问题,有
objectness score
和class scores
来代表可能性;而对于回归问题没有可能性的表示,bbox的坐标是一个确定的输出,并没有bbox的置信度。 objectness score
和bbox并没有很大的依赖性,并不能代表bbox的结果有多么确定。
Because there is only one correct answer (i.e., the GT) for the bbox of an object, complex modeling is not required for predicting the localization uncertainty. In other words, the uncertainty of bbox can be modeled using each single Gaussian model of t x t_x tx, t y t_y ty, t w t_w tw, and t h t_h th.
用单个高斯模型代表可能性
均值代表了bbox的坐标,而方差代表了bbox坐标的不确定性。对于w、h来说,并没有通过sigmoid的函数,可以有正有负。
Reconstruction of loss function
GT编码:
x G 、 y G 、 w G 、 h G x^G、y^G、w^G、h^G xG、yG、wG、hG是GT box相对于原图的比例;
上述所计算的offset是resize后的长和宽相对于anchor的比例;
I W 、 I H IW、IH IW、IH是resized image的长和宽;
W 、 H W、H W、H是特征图的长和宽;