原视频来自B站UP主霹雳吧啦Wz
YOLOv4:Optimal Speed and Accuracy of Object Detection(目标检测得最佳速度和精度)
网络结构:
- Backbone:CSPDarknet53
- Neck:SPP,PAN
- Head:YOLOv3
优化策略:
- Eliminate grid sensitivity
- Mosaic data augmentation
- Iou threshold(match posotive samples)
- Optimizered Anchors
- CIOU
CSPDarknet53的优点:
1.增强了CNN的学习能力,加快了网络的推理速度
2.移除了计算的瓶颈
3.降低显存的使用
网络结构-SPP
Spatial Pyramid Pooling(空间的金字塔池化)
能在一定程度上解决多尺度的问题
网络结构-PAN
Path Aggregation Network(路径聚合网络)
(a)FPN特征金字塔结构,将高层的语义信息与低层进行融合。
(b)与FPN相反,将低层的语义信息与高层融合
将(a),(b)两个模块合在一起就是PAN
YOLOv4的网络结构
注意: 同样的shape(宽、高、深度)才能进行contact(按深度进行拼接)操作
优化策略-Eliminate grid sensitivity(消除网格敏感度)
优化策略-Mosaic data augmentation (马赛克数据增强)
将4张不同的图片按照一定的规律拼接在一起 ,扩充训练样本的多样性
优化策略-IoU threshold(match positive samples) 匹配正样本的IoU阈值
YOLOv3中每一个grid cell生成3个anchor 模板(Template)
如果多个AT达到阈值,则都作为正样本,来增加正样本的数量。
将中心点所在的grid cell上边和左边的网格的AT2都作为正样本,进一步扩充正样本的数量
优化策略-Optimizered Anchors(优化anchor)
优化策略-CIOU