下文中的开源实现以腾讯的OneDetection作为分析对象。
yolo v3基本原理:
相对于yolo v2,yolo v3做了如下改进:
更换了backbone网络,使用darknet53,没有pool层,全部使用卷积,降采样5次
使用类似于FPN的技术,融合多层特征预测
对分类和置信度使用二分类交叉熵(v1和v2全部使用MSE)
yolo v3是2018年出来的,比SSD和retinanet都要晚,在map0.5这个指标上速度比SSD和retinanet快很多。在工业应用上面map0.5已经满足使用,并且yolo v3简介,文档丰富,还有tiny版本等一些列变种。最重要的是速度非常快,比SSD和retinanet都要快。如果采用COCO mAP50做评估指标(不是太介意预测框的准确性的话),YOLO3的表现相当惊人,如下图所示,在精确度相当的情况下,YOLOv3的速度是其它模型的3、4倍。
网络结构:
Tencent项目的yolov3网络