Object Detection : One-stage Detector YOLO

最新推荐文章于 2021-06-19 22:45:04 发布

小威威__

最新推荐文章于 2021-06-19 22:45:04 发布

阅读量984

点赞数

分类专栏： Object-Detection 文章标签：人工智能计算机视觉

本文链接：https://blog.csdn.net/linwh8/article/details/104367240

版权

YOLO是一种快速、端到端的目标检测方法，它将检测问题视为回归，利用全局图像信息。虽然其准确度稍逊于两阶段检测器，但YOLO在小目标检测和定位上存在挑战。YOLO通过将图像分成网格，每个网格预测检测框和类别概率，以实现高效检测。设计上，YOLO包括网络设计和训练细节，如预训练和微调，以及损失函数的优化策略。

摘要由CSDN通过智能技术生成

现有的目标检测器主要分为两种类型：两阶段(two-stage)和单阶段(one-stage)。这两种检测器的设计思想有很大的不同：两阶段检测器主要将检测问题归结为分类问题(classification)，而单阶段检测器主要是将检测问题定义为回归问题(regression)。不仅如此，两种检测器在时间、性能上也有一定的差距。接下来我将会沿着单阶段的主线，根据时间顺序，进一步了解单阶段检测器的发展。

YOLO -> DenseBox -> SSD -> YOLO v2 -> Retina -> YOLO v3 -> CornerNet -> CenterNet -> AlignDet

You Only Look Once: Unified, Real-Time Object Detection

论文地址：1506.02640

1. YOLO的优缺点(Pros and Cons)

【从摘要(Abstract)和介绍(Introduction)】
在这里插入图片描述

优点
- 速度快(fast)：采用回归思想，无需产生区域提议(proposals)，是一个端到端的模型
- 利用全局信息(global)：输入是整张图片(entire image)，而不是图片其中的一部分(part)
- 泛化能力(generalization)：在非自然图片(natual image)如艺术作品领域(artwork)，检测结果(results)较好
缺点
- 准确率不如两阶段检测器(accuracy behind)：体现在定位(localization)不够准确，小目标(small object)检测难
- YOLO在检测框的预测上有较强的空间限制(strong spatial constraints)：一个网格单元预测两个检测框，并且一个网格单元内只能有一种类别预测。这导致模型缺乏对相邻的多个目标检测的能力，尤其是一大群小目标(small objects that appear in groups)
- YOLO对新的或者不寻常(new or unusual)的纵横比、设置(configurations)的泛化能力较弱：因为模型是从数据中学习如何预测检测框，有一定的数据依赖性
- 损失函数的设计有缺陷：对于大检测框与小检测框的错误一视同仁：对于某些小错误，在小检测框会对IOU有很大的影响，在大检测框上相对影响小一些。

2. YOLO的设计思想(Design)

YOLO 使用全图特征去预测检测框(bounding boxes)及其类别(classes)。与两阶段检测器的区域提议(region proposals)不同的是，YOLO不预先产生可能包含目标(objects)的区域(proposals)，而是将一张图片分割成S x S的网格(grid)，每个网格单元(cell)都可能包含目标，换句话说，这些网格单元便是YOLO给出的可能包含目标的区域。对于每个网格单元，如果目标的中心(center)落在其中，该网格便负责对该目标进行检测。
在这里插入图片描述
每个网格单元负责预测B个候选框及其对应的B个置信度(confidence scores), 此处置信度指网格单元包含目标及检测框预测准确的置信度(原文链接1)，定义为 $Pr(Object)*IOU_{pred}^{truth}$ 。