Yolo框架简介

最新推荐文章于 2025-08-14 21:16:05 发布

原创

最新推荐文章于 2025-08-14 21:16:05 发布 · 5.4k 阅读

21 ·

CC 4.0 BY-SA版权

YOLO（You Only Look Once）是一种快速的对象识别和定位算法，以其高效和实时性著称。通过统一的网络设计，YOLO将候选区和识别阶段结合，避免了R-CNN系列的慢速处理。尽管在精度和小目标检测上存在不足，但YOLO在背景预测错误率上的表现优于Fast R-CNN，并可以通过与其他方法结合提升整体效果。

YOLO（You Only Look Once）是一种基于深度神经网络的对象识别和定位算法，其最大的特点是运行速度很快，可以用于实时系统。现在YOLO已经发展到v4版本.
论文地址：链接: https://pjreddie.com/media/files/papers/yolo.pdf.

Yolo结构的作用：

对象识别和定位，可以看成两个任务：找到图片中某个存在对象的区域，然后识别出该区域中具体是哪个对象。对象识别这件事（一张图片仅包含一个对象，且基本占据图片的整个范围），最近几年基于CNN卷积神经网络的各种方法已经能达到不错的效果了。所以主要需要解决的问题是，对象在哪里。
在这里插入图片描述

Yolo与R-CNN系列的对比：

RCNN开创性的提出了候选区(Region Proposals)的方法，先从图片中搜索出一些可能存在对象的候选区Selective Search，大概2000个左右，然后对每个候选区进行对象识别。大幅提升了对象识别和定位的效率。不过RCNN的速度依然很慢，其处理一张图片大概需要49秒。因此又有了后续的Fast RCNN 和 Faster RCNN，针对RCNN的神经网络结构和候选区的算法不断改进，Faster RCNN已经可以达到一张图片约0.2秒的处理速度。
YOLO创造性的将候选区和对象识别这两个阶段合二为一，看一眼图片（不用看两眼哦）就能知道有哪些对象以及它们的位置。实际上，YOLO并没有真正去掉候选区，而是采用了预定义的候选区（准确说应该是预测区，并不是Faster RCNN所采用的Anch