yolov3在目标追踪方面是借鉴了其它算法的优点形成的,既加快了运算时间又提高了识别的精度。单类多目标的有MTCNN,多类多目标的有RCNN系列和YOLO系列。
RCNN系列:RCNN通过像素聚类建议框,svm支持向量机的方法去检测,测试的时候运行时间太慢。fast--Rcnn在得到的特征图上面去画建议框,每个特征点都去运算一遍,没有使用nms,iou所以运行时间也很慢,但是比RCNN快了很多。然后是faster--RCNN多训练了一个置信度的网络,精确度很高,运算时间也快。
YOLO系列:YOLOv1传入固定大小的224*224的图片输出的是全连接,将图片划分成7 * 7的大小网络,认为的在有目标对象中心点的网格画2中建议框,因此检测的准确率不高。YOLOv2传入固定大小的416*416的图片,采用了9种建议框,网络使用的是darknet19,如果两个类别的中心点都在同一个格子里,只能挑选出置信度最大的那一个类别,因此不能够解决两个物体的中心点都在一个格子里面的情况。yolov3就相对于yolov1,yolov2改进了很多,针对大中小的物体分别给出了大中小的3类建议框每类3个建议框,网络也输出3种特征图,分别是13*13的用于检测大物体的,26*26的用于检测中等物体的,52*52的用于检测小物体的,并且对每种输出都设置了专有卷积来提高运算的精度,因为只去检测置信度较大的框,所以运算时间也比较快。在yolov1和yolov2之间还出现过ssd,yolov3就是借鉴了ssd的针对不同目标大小,输出不同大小的3类特征图,对小目标也能够友好的检测。