【YOLO系列】YOLO-v1:统一的实时对象检测算法。

1. 介绍

YOLO算法是一种新的目标检测算法。以前的目标检测算法都是基于分类思想的算法。
相反,YOLO算法是一种基于回归思想的目标检测算法。
YOLO算法非常简单,就只有一个神经网络。
它可以同时定位物体的边界框和预测类别概率。

2. 优点

相对于以前的目标检测算法,YOLO算法有其优越性。

第一:它非常的快。它可以每秒45帧的速度在GPU上运行,其快速版本的速度可以超过150FPS。
第二:它是基于全局的图片进行类比预测。与基于滑动窗口(DPM)和候选区域提取(RNN)的技术不同,YOLO在训练和测试期间会看到整个图像,因此它隐式地编码有关类及其外观的上下文信息。更加准确。
第三:YOLO可以学习更加广泛的目标表示信息。在自然图像(也就是实际的样子)上进行训练后,在艺术图片(也就是加了滤镜的样子)上进行测试时,YOLO在很大程度上优于DPM和R-CNN等顶级检测方法。

3. 大统一模型

在这里插入图片描述
在这里插入图片描述
这两个我使用YOLO算法实战的例子。当我们将这两张图片输入给训练好的YOLO模型后,可以得到以上的输出。
可以看到YOLO算法非常的精确,在编译时也可以感受到,YOLO真的是非常的快。
在这里插入图片描述
YOLO算法最核心的思想就是,大统一模型
它将独立分散的算法组件统一到一个神经网络中。
比如R-CNN算法,就是一个two-step算法,它先进行物体边界框的定位,再进行物体类别的预测。
但是YOLO就是一个one-step算法,它可以同时完成定位和预测。
言归正传啊,正因为这个大统一模型的思想,YOLO才做到了one-step的效果。

第一点,这个系统将输入的图片划分为SXS个小格,如果物体的中心存在这个小格中,那么这个小格就负责预测这个物体。
第二点,每一个小格预测B个边界框。
第三点,每一个边界框预测值包括边界框的中心坐标(x,y),宽w,高h和置信度confidence,置信度反应的是边界框里存在物体的概率。
第四点,每一个小格只预测C种类别的概率,这里的C跟B没有关系

最后输出一个维度是SXSX(BX5+C)的张量
接下来我们来学习一下YOLO神经网络的结构

4. 神经网络结构

在这里插入图片描述

YOLO的神经网络结构是在GoogLeNet的基础上发展来的,
不过,YOLO使用1x1的卷积层后跟着3x3的卷积层的卷积层组会代替了GoogLeNet的inception模块
前面24层卷积层从图像中提取特征,其后通过2层全连接层来预测输出类别概率和坐标
需要提到的是,YOLO的神经网络不光是卷积层还是全连接层都是采用leaky ReLU作为激活函数来使用的。

5. 缺点

我们前面介绍了YOLO的优点,介绍了YOLO算法。那YOLO是不是就没有缺点呢?
其实不是的。YOLO也有缺点,

第一点,YOLO在准确性方面仍落后于最新的检测系统。尽管它可以快速识别图像中的对象,但仍难以精确定位某些物体,尤其是一些小的物体。
第二点,YOLO采用的误差函数并不合理。YOLO采用了平方和函数作为误差函数,它非常易于优化,但无益于增大mAP。它不合理在对定位误差和分类误差的权重相等。为了解决这个问题,YOLO增加了边界框坐标预测的损失权重,并减少了不包含对象的框的置信度预测的损失权重。
第三点,YOLO限制了边界框预测的数量。每个网格单元仅预测两个框,并且只能具有一个类。

尽管YOLO算法存在诸多的缺点,但是当它与一些优秀的目标检测算法对比时,依然也非常能打。

6. 对比

我们将YOLO与几个顶级检测算法进行了比较,突出了关键的异同。
DPM算法是基于滑动窗口的目标检测算法,R-CNN和它的变体(也就后来Fast R-CNN,最新的Faster R-CNN),也都是基于候选区域提取的目标检测算法。它们都是two-step算法,相对于YOLO来说,YOLO更加统一,更加快,更加全局。
Deep MultiBox算法也是只用一个神经网络来进行图标检测和定位,但Deep MultiBox算法无法进行图像的批分类任务,相当于YOLO来说,YOLO更加完整。

7. 结论

到此,YOLOv1算法的理论学习就差不多了,回过头来看,YOLO是一个统一的目标检测算法,它只有一个神经网络就可以从全局来同时预测和定位物体的位置和类别概率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值