【深度学习】【ICCV2019】Gaussian YOLOv3


【ICCV2019】Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Abstract

FP(false positive)对无人驾驶会造成严重的后果,比如会造成不必要的刹车,这样会造成驾驶的不稳定性,本文通过在检测阶段使用the predicted localization减少FP,增加TP,从而提高准确度。
数据集:KITTI & BDD(Berkeley deep drive)

Introduction

无人驾驶目标检测算法应满足两点要求:

  1. 对于道路目标,例如车、行人、交通灯、交通标志等,具有高检测准确度。
  2. 实时的检测速度

问题:大多数算法尽管知道被检测物体的坐标,但是该bbox的结果的不确定性未知,结合不确定性对于降低FP非常重要。

基础:YOLOv3实时,非常适合无人驾驶,但相较于两阶段检测器准确率低。

改进:

  1. 对YOLOv3的bbox坐标进行建模,只输出确定性值作为高斯参数(均值和方差)
  2. 重新设计了损失函数

Background

主要是对YOLO系列进行描述
在这里插入图片描述

Gaussian YOLOv3

Gaussian modeling

出发点:

  1. 对于目标检测中的分类问题,有objectness scoreclass scores来代表可能性;而对于回归问题没有可能性的表示,bbox的坐标是一个确定的输出,并没有bbox的置信度。
  2. objectness score和bbox并没有很大的依赖性,并不能代表bbox的结果有多么确定。

Because there is only one correct answer (i.e., the GT) for the bbox of an object, complex modeling is not required for predicting the localization uncertainty. In other words, the uncertainty of bbox can be modeled using each single Gaussian model of t x t_x tx, t y t_y ty, t w t_w tw, and t h t_h th.

用单个高斯模型代表可能性
在这里插入图片描述
在这里插入图片描述
均值代表了bbox的坐标,而方差代表了bbox坐标的不确定性。对于w、h来说,并没有通过sigmoid的函数,可以有正有负。

Reconstruction of loss function

GT编码:
在这里插入图片描述
x G 、 y G 、 w G 、 h G x^G、y^G、w^G、h^G xGyGwGhG是GT box相对于原图的比例;
上述所计算的offset是resize后的长和宽相对于anchor的比例;
I W 、 I H IW、IH IWIH是resized image的长和宽;
W 、 H W、H WH是特征图的长和宽;

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值