这大概是在2017年底的时候写的,当时还研究了一下faster rcnn和ssd的推理过程。后来YOLO v3出来了,这个就放在一边没理了。现在发出来凑个篇数。
YOLO (You only look once) 是业界第一个端到端的图像目标检测方法,和Faster RCNN相比,不再需要RPN(region proposal network)来生成候选区域ROIs,因此,检测速度更快,更加可以满足实时检测的要求。YOLO第一版本算法 将一张图片均分为SxS个网格(grid),每个网格对应B个bounding box,但是,对目标概率的检测是基于每个网格进行,而不是基于每个bounding box进行,因此,碰到目标不是落在单个网格中的情况,检测准确性有所下降。YOLO v2 做了很多改进,再次确定了YOLO在图像目标检测领域的重要地位,和SSD(single shot multibox detector) 并列为端到端图像目标检测的两大流派。
YOLO 算法都已由作者基于Darknet 实现并开源 ,本文基于YOLO v2的例子程序,以yolo.cfg 为网络模型,yolo-voc.weights 为模型参数(支持80种分类),dog.jpg 为待检测图像,分析了YOLO v2算法的推理过程。这三个文件的网址是:
https://github.com/pjreddie/darknet/blob/master/cfg/yolo.cfg
https://pjreddie.com/media/files/yolo-voc.weights
https://github.com/pjreddie/darknet/blob/master/data/dog.jpg
- YOLOv2整体网络结构