【深度学习】【ICCV2019】Gaussian YOLOv3

最新推荐文章于 2024-05-18 09:58:11 发布

Hanawh

最新推荐文章于 2024-05-18 09:58:11 发布

阅读量404

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_36530992/article/details/103237445

版权

Gaussian YOLOv3

Abstract
Introduction
Background
Gaussian YOLOv3
Experimental Results

【ICCV2019】Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Abstract

FP(false positive)对无人驾驶会造成严重的后果，比如会造成不必要的刹车，这样会造成驾驶的不稳定性，本文通过在检测阶段使用the predicted localization减少FP，增加TP，从而提高准确度。
数据集：KITTI & BDD(Berkeley deep drive)

Introduction

无人驾驶目标检测算法应满足两点要求：

对于道路目标，例如车、行人、交通灯、交通标志等，具有高检测准确度。
实时的检测速度

问题：大多数算法尽管知道被检测物体的坐标，但是该bbox的结果的不确定性未知，结合不确定性对于降低FP非常重要。

基础：YOLOv3实时，非常适合无人驾驶，但相较于两阶段检测器准确率低。

改进：

对YOLOv3的bbox坐标进行建模，只输出确定性值作为高斯参数（均值和方差）
重新设计了损失函数

Background

主要是对YOLO系列进行描述
在这里插入图片描述

Gaussian YOLOv3

Gaussian modeling

出发点：

对于目标检测中的分类问题，有objectness score和class scores来代表可能性；而对于回归问题没有可能性的表示，bbox的坐标是一个确定的输出，并没有bbox的置信度。
objectness score和bbox并没有很大的依赖性，并不能代表bbox的结果有多么确定。

Because there is only one correct answer (i.e., the GT) for the bbox of an object, complex modeling is not required for predicting the localization uncertainty. In other words, the uncertainty of bbox can be modeled using each single Gaussian model of $t_x$ , $t_y$ , $t_w$ , and $t_h$ .

用单个高斯模型代表可能性
在这里插入图片描述

均值代表了bbox的坐标，而方差代表了bbox坐标的不确定性。对于w、h来说，并没有通过sigmoid的函数，可以有正有负。

Reconstruction of loss function

GT编码：
在这里插入图片描述
$x^G、y^G、w^G、h^G$ 是GT box相对于原图的比例；
上述所计算的offset是resize后的长和宽相对于anchor的比例；
$I W 、 I H$ 是resized image的长和宽；
$W 、 H$ 是特征图的长和宽；

最低0.47元/天解锁文章

Hanawh

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】【ICCV2019】Gaussian YOLOv3

Gaussian YOLOv3AbstractIntroductionBackgroundGaussian YOLOv3Gaussian modelingReconstruction of loss functionUtilization of localization uncertaintyExperimental Results【ICCV2019】Gaussian YOLOv3: An Ac...
复制链接

扫一扫

专栏目录