YOLO 论文解读

YOLO是2016年提出的一种实时目标检测方法,它摒弃了区域提议步骤,将目标检测直接转化为回归问题,提高了检测速度。通过网络结构优化,YOLO能以高帧率运行,但在检测小物体时精度较低。尽管存在局限,YOLO为后续的SSD等方法奠定了基础,推动了目标检测领域的发展。
摘要由CSDN通过智能技术生成

You Only Look Once:Unified, Real-Time Object Detection

论文下载地址
github源码地址

简介

YOLO是2016年CVPR的paper,这是RBG继RCNN,fast-RCNN,faster-RCNN以后,又一力作。针对目标检测中,无法实现实时性检测的问题,独辟蹊径,开创了目标检测的新思路。在RCNN中,作者将目标检测的问题转化到分类上来,提出了region proposal+cnn feature+ svm的思路。在以后的sppnet,fast-rcnn,faster-rcnn都沿袭了这个思路,对每个过程进行优化,检测精度也不断提升,但是这样做有一个很大的缺陷就是时间效率不高,无法达到实时性的检测,最快的faster-rcnn ZF网络也就能达到18fps的速度。所以,作者又提出了一种新的思路,直接将目标检测转化到回归上,直接用一张图片得到bounding box和所属类别。

YOLO 具体过程

YOLO具体过程如下图所示:


这里写图片描述

YOLO直接从一张图片中提取特征,来预测每一个Bounding box,最小化和ground turth的误差。由于YOLO是一个端到端的训练,并且中间没有region proposal生成,所以在速度上有了很大的提升。
首先 将图片划分为 S×S 的网格,每一个网格中预测B个Bounding box 和confidence score。如果每一个网格中有物体存在,那么confidence score 为 Pr(object)IOUtruthpred ,如果不存在物体,则为0。物体的位置用 (x,y,w,h) 表示, (x,y) 表示物体的中心位置。每个网格还会预测C类的可能性 Pr(Classi|Object)

Pr(Classi|Object)Pr(Object)IOUtrut
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值