上文详解了YOLO v4 的网络架构。本文探讨下 YOLO v4 使用的 trick。
对于目标检测任务,分为Backbone, Neck, Head 部分。其中 Backbone 常在 ImageNet 上进行图像分类的预训练,然后目标检测架构中的Backbone即预训练好的去掉分类层的网络。
1. 图像分类预训练采用的技巧
1.1 Data augmentation
数据增广的目的在于增加输入图像的多样性,从而使得设计出来的目标检测模型对不同环境的图像具有更高的鲁棒性。
CutMix
论文:https://arxiv.org/abs/1905.04899v2
代码&#x