论文主要贡献:
1.利用单GPU即可训练一个目标检测器.
2.验证了Bag-of-Freebies 和 Bag-of-Specials方法在训练目标检测器当中的作用。
3.对包括CBN、PAN、SAM在内的现有方法进行了改进。
数据增强:
1.Mosaic数据增强
参考CutMix将四张图像(每张各自进行数据增强)拼接成一张进行训练:
2.SAT数据增强(Self-adversarial-training自对抗训练)
损失函数:
1.IOU Loss:实际和预测框无相交即IOU=0时无法进行梯度计算,且相同的IOU对应多种框的相对位置,无法反应实际情况。
2.GIOU:引入了最小封闭形状C可以把A和B包括在内,优点在于在A框B框不重叠的情况下可以使得预测框向真实框逼近,缺点不足在于A和B重叠情况下GIOU又无法评价好坏了。
3.DIOU:式中分式分子为预测框与真实框的中心点欧式距离,式中分母为可以覆盖A和B两框的最小BOX对角线长度。优点在于直接利用距离计算,速度更快解决了GIOU的问题。
4.YOLO V4选用CIOU作为损失函数:损失函数必须考虑重叠面积、中心点距离与长宽比,用v代表长宽比用α代表权重参数。
SAM空间注意力机制:
在原始SAM基础上,把经过池化再卷积的过程改为一次卷积。
PAN:
原有特征融合都是加法操作,现在改为拼接操作,虽然特征更多但可以提升精度。
Mish激活函数:
相比Relu激活函数,计算量增加,效果提升一点
公式:
整体网络架构: