这篇写的很好:
https://zhuanlan.zhihu.com/p/150127712
和YOLO V3对比,主要做了以下改变:
- 相较于YOLO V3的DarkNet53,YOLO V4用了CSPDarkNet53
- 相较于YOLO V3的FPN,YOLO V4用了SPP+PAN
- CutMix数据增强和马赛克(Mosaic)数据增强
- DropBlock正则化
- 等等
2.1 BackBone:CSPDarknet53
YOLO V4中,选择了具有CSP(Cross-stage partial connections跨阶段连接)的darknet53。
CSP结构即是在resn的头尾增加了connections。
2.2 Neck:SPP+PAN & Head:YOLO HEAD
目标检测模型的Neck部分主要用来融合不同尺寸特征图的特征信息。常见的有MaskRCNN中使用的FPN等,这里我们用EfficientDet论文中的一张图来进行说明。
可见,随着人们追求检测器在COCO数据集上的MAP指标,Neck部分也是出了很多花里胡哨的结构呀。
本文中的YOLO V4就是用到了SPP(Spatial pyramid pooling)+PAN(Path Aggregation Network,上图的结构b)。
3.损失函数
YOLO V4相较于YOLO V3,只在bounding box regression做了创新,用CIOU代替了MSE,其他两个部分没有做实质改变