YOLO(You Only Look Once)是一个能够同时兼顾实时性和精度的目标检测算法,与其他“检测分两阶段”的目标检测算法,例如R-CNN、Fast RCNN、Faster RCNN不同的是,YOLO将整个识别过程看做一个回归过程,用一个统一的网络对图片进行预测,同时输出目标类别和位置。
YOLO有三个版本,当然随着版本的增加,性能也逐渐提升。以v3为例,YOLOv3比Faster RCNN速度快(速度快即在同等计算环境下,计算量少)的核心原因在于大量使用1x1卷积减少参数量,且去掉了全连接层(Faster RCNN的全连接层计算量将近占到了整体计算量的一半左右)。YOLOv3在如此快速的情况下,仍能保持高精度的原因是由于网络层数的加深,从而得到了更加抽象、复杂的特征。粗略计算了下,在输入图像大小为416x416x3情况下,YOLOv3的计算量约为40亿次,Faster RCNN的计算量约为80亿次。
一、YOLOv1
1、算法原理
未完待续。。。