论文提要“You Only Look Once: Unified, Real-Time Object Detection”

原创 2015年07月08日 14:51:39

项目主页:http://pjreddie.com/darknet/yolo/

这篇文章着重在检测的速度提升,区别于之前的方法是用分类器来做检测,文章对bbox和对应的类概率进行回归,检测速度可以达到45f/s,mAP与原始的R-CNN差不多。

出现原因:
CNN在分类上已经可以达到实时,而在检测上R-CNN需要几秒的时间处理一张图片,主要是由于proposal的提取时间需要约1~2s的时间,然后还有很多后续步骤:proposal的特征学习,矫正bbox,消除虚警等,最好的方法需要2~40s时间处理完毕。并且R-CNN的每个检测步骤是分离的不便整体优化。

一体化的检测:
输入图像划分为7*7的网格,如果一个物体的中心落在某个格子内,则对应的格子负责检测该物体。每个网格预测一个bbox和对应的类概率,系统流程如下:
这里写图片描述

系统使用cnn实现并在VOC上测试,初始卷积层从图像中提取特征,全连接层预测概率和坐标。网络框架与GoogleNet类似,拥有24个卷积层和2个全连接层,网络如下图所示,最终的输出是对7*7网格的预测,每个网格预测20类的概率和坐标。
这里写图片描述

网络训练:
使用ImageNet进行初始训练,使用图3中的前20层加一个maxpooling层及两个全连接层进行训练,1星期训练得到top-5error为86%。由于检测需要更为精细的信息,作者将网络输入由224*224调整至448*448.

网络的最后一层预测类概率和bbox,在最后一层使用逻辑激活函数,其他层使用leaky ReLU:
这里写图片描述

网络输出使用平方和误差,并引入尺度因子λ 对类概率和bbox的误差进行加权,同时为了反映出偏离在大的bbox中的影响比较小,文章使用bbox宽高的平方根,最终的损失函数是:
这里写图片描述
为了避免过拟合,作者使用了dropout和数据增加。

参数化类概率:
49个网格给出20类的概率,一幅图像产生980个预测的概率,大部分概率为0。这会导致训练离散,作者引入了一个变量解决这个问题:即某位置是否有物体存在的概率。因此除了20个类概率还有一个“objectness”概率Pr(Object),则某位置每一类的非条件概率为Pr(Object)与条件概率的乘积;
Pr(Dog) = Pr(Object)*Pr(Dog|Object)
在每个位置都对Pr(Object)进行更新,而只在有物体存在时才对Pr(Dog|Object)更新。

YOLO的限制:
由于YOLO具有极强的空间限制,它限制了模型在邻近物体上的预测,如果两个物体出现在同一个cell中,模型只能预测一个物体,所以在小物体检测上会出问题。另外模型对训练数据中不包含的物体或具有异常长宽比的物体扩展不是太好。loss函数对大小bbox采取相同的error也是个问题。

实验结果:
在voc2012上的实验结果对比如下,YOLO在不基于R-CNN的方法中mAP最高,但比state-of-art低。
这里写图片描述

YOLO的速度提升比较明显,在voc2007上的实验结果对比如下:
这里写图片描述

You Only Look Once论文中文翻译

You Only Look Once 统一的实时目标检测 Abstract  我们提出YOLO,一种新的目标检测方法。以前的对目标检测的工作重新使用分类器来执行检测。相反,我们将目标检测框架为回...
  • qq_14839543
  • qq_14839543
  • 2017年02月16日 22:06
  • 3093

论文阅读笔记:You Only Look Once: Unified, Real-Time Object Detection

1. YOLO的核心思想 2. YOLO的实现方法 3. YOLO的训练技术细节 4. YOLO的缺点
  • tangwei2014
  • tangwei2014
  • 2016年03月17日 17:06
  • 17505

【目标检测】[论文阅读][yolo] You Only Look Once: Unified, Real-Time Object Detection

论文名称《You Only Look Once: Unified, Real-Time Object Detection》摘要1、之前的目标检测方法采用目标分类思想解决检测问题,本文提出一个基于回归的...
  • dataningwei
  • dataningwei
  • 2017年09月24日 15:59
  • 293

YOLO原理--读《You Only Look Once:Unified, Real-Time Object Detection》

见个人博客: https://ziyubiti.github.io/2016/12/25/yolopaper/
  • ziyubiti
  • ziyubiti
  • 2016年12月30日 11:23
  • 1545

YOLO:Real-Time Object Detection学习笔记

yolo检测系统分三步: (1)将输入图像resize 到​; (2)运行一个简单的卷积网络对输入图像进行处理; (3)对模型输出confidence进行阈值处理得到检测结果; 相比较于其他实时系统,...
  • u011961856
  • u011961856
  • 2017年08月02日 13:53
  • 467

YOLO: Real-Time Object Detection

home darknet coq tacticspublicationsprojectsrésumé YOLO: Real-Time Object Detecti...
  • Real_Myth
  • Real_Myth
  • 2016年05月03日 16:34
  • 5799

Yolo - Real-Time Object Detection

https://pjreddie.com/darknet/yolo/
  • cnbird2008
  • cnbird2008
  • 2017年06月07日 10:49
  • 911

论文阅读:You Only Look Once: Unified, Real-Time Object Detection

这篇今年 CVPR 2016 年的检测文章 YOLO,我之前写过这篇文章的解读。但因为不小心在 Markdown 编辑器中编辑时删除了。幸好同组的伙伴转载了我的,我就直接考过来了。以后得给自己的博文留...
  • u010167269
  • u010167269
  • 2016年09月23日 19:07
  • 6677

YOLO(You Only Look Once)算法详解

这篇博客主要介绍下YOLO算法,以及如何在darknet上快速使用YOLO算法。YOLO是目前比较流行的object detection算法,速度快且结构简单,其他的object detection算...
  • u014380165
  • u014380165
  • 2017年05月21日 22:58
  • 8747

You Only Look Once: Unified, Real-Time Object Detection(2)

Preface 今天详细的看一下 CVPR 2016 年这篇:You Only Look Once: Unified, Real-Time Object Detection。另外,这篇的作者也有...
  • u014696921
  • u014696921
  • 2016年11月12日 17:12
  • 894
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:论文提要“You Only Look Once: Unified, Real-Time Object Detection”
举报原因:
原因补充:

(最多只允许输入30个字)