YOLOv4:Optimal Speed and Accuracy of Object Detection
目标检测的最佳速度和准确性:
有大量的功能据说可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些特性的组合进行实际测试,并对结果进行理论验证。某些特性可用于某些特定的问题,或仅用于小规模的数据集;而一些特性,如批处理规范化和剩余连接,则适用于大多数模型、任务和数据集。我们假设这些通用特性包括加权剩余连接(WRC)、跨阶段部分连接(CSP)、跨小批量标准化(CmBN)、自反训练(SAT)和激活。我们使用新特性:拉力,CSP, CmBN,坐,米什激活,马赛克数据增加,CmBN, DropBlock正规化,意识丧失,并结合一些实现先进的结果:43.5%的美联社(65.7% AP50)女士可可数据集的实时速度∼65 FPS特斯拉V100。
Bag of freebies
改变训练策略:只增加训练成本,不影响测试精度
Bag of specials
只增加少量推理成本却能显著提高对象检测精度的plugin modules和post-processing methods
YOLOv1:
作者:Joseph Chet Redmon
主要代表作:yolov1(Darknet)、yolov2、yolov3、Xnor-net
图像分割:
语义分割(Semantic Segmentation):
对每一个像素分类(不管该像素属于哪几个物体,只管属于什么类别),
实例分割(Instance Segmentation):
输出同一类别的不同实例
目标检测的两个流派:
YOLOv1 目标检测框架——one stage:
R-CNN:
2000个Regions of interest(RoI,候选框)–>喂入卷积神经网络–>用支持向量机、Bbox reg去分类和回归
Faster-RCNN——two stage:
学习该博主的视频:视频地址