YOLO V3的原理学习笔记
01_YOLOv3-introduction.jpg
通过笔记的方式记录自己学习YOLO V3的模型原理.
YOLO 是目标检测算法中常用的一种模型,目前最新的YOLO V3版本不论速度和精度上都有了很大进步,yolo算法在实际应用中能很好平衡精度和速度,
所以我们在实际应用中使用的还是比较多的.
0. What is Yolo?
YOLO即“You Only Look Once”, 是目标检测算法的一种,是采用一步算法实现目标检测的算法,比较两部算法的速度上较快.YOLO一直以速度快而见长. 识别精度比目前优秀的mask rcnn相比还有差距,但是如果在消费级的GPU上实现实时的目标检测,mask RCNN还是不能实现实时的效果,采用YOLO,尤其是YOLO3,在不牺牲太多精度的情景下,非常轻松实现实时的检测效果.
1. YOLO v3的结构
YOLOv3的paper中描述的是基于Darknet-53的网络,我们将Darknet-53转换成keras下的代码.
Darknet-53.png
网络模型的输入为:( 416, 416, 3)就是一个416*416的彩色图片.
输出为:包含box和类型的列表,表示图片中识别到的目标. (𝑝𝑐,𝑏𝑥,𝑏𝑦,𝑏ℎ,𝑏𝑤,𝑐).
[图片上传失败...(image-145b-1570409442271)]
2. YOLO的原理
原始思路:
如果采用最原始的思路,我们会采用窗口滑动的方法,逐个检测目标,通过image classi