一、前言
本文主要记录up在学习YOLOV1的笔记。欢迎大家一起阅读学习,并且也欢迎大家指出其中的错误理解以及补充相关知识。
二、摘要
我们介绍了 YOLO,一种新的物体检测方法。之前关于对象检测的工作重新利用分类器来执行检测。取而代之的是,我们将对象检测视为空间上分离的边界框和相关类概率的回归问题。单个神经网络在一次评估中直接从完整图像中预测边界框和类概率。由于整个检测管道是单一网络,因此可以直接在检测性能上进行端到端优化。
我们的统一架构速度非常快。我们的基本 YOLO 模型以每秒 45 帧的速度实时处理图像。该网络的较小版本Fast YOLO每秒处理155帧,同时仍能实现其他实时检测器的两倍mAP。与最先进的检测系统相比,YOLO犯了更多的定位错误,但在不存在的情况下预测错误检测的可能性要小得多。最后,YOLO学习对象的非常通用的表示形式。在毕加索数据集和人物艺术数据集上,从自然图像泛化到艺术品时,它的性能远远优于所有其他检测方法,包括 DPM 和 R-CNN。
三、创新点
相比于之前的R-CNN等网络,YOLOV1为一阶段网络,单独的CNN模型,实现了端到端的目标检测,它把目标检测问题看作是一个回归问题。
YOLO将目标检测问题作为回归问题。它将输入图像分成S×S的网格,如果一个物体的中心点落入到一个网格中,那么该网格就负责预测该物体,一个格子只能预测一个物体,生成两个预测框。
输入:图片
输出:图片中目标对象的boxes信息(x、y、w、h和c)以及类别概率信息
四、缺点
1、由于最后会输出7×7的网格,当小目标物进行多次卷积之后,,其的特征图可能会发生缺失,导致无法成功检测。
2、当两个目标物的中心都在一个网格时,会发生漏检情况。
3、当目标物出现新的长宽比例时,检测的效果较差。
五、说明
本文章主要作为学习笔记,图源均来自网络,侵删!