目标检测各种Tricks总结
作者将所有的Tricks可以分为两类:
在不增加推理成本的前提下获得更好的精度,而只改变训练策略或只增加训练成本的方法,作着称之为 “免费包”(Bag of freebies);
只增加少量推理成本但能显著提高目标检测精度的插件模块和后处理方法,称之为“特价包”(Bag of specials)
下面分别对这两类技巧进行介绍。
(1)免费包
以数据增强方法为例,虽然增加了训练时间,但不增加推理时间,并且能让模型泛化性能和鲁棒性更好。像这种不增加推理成本,还能提升模型性能的方法,作者称之为"免费包",非常形象。
下面总结了一些常用的数据增强方法:
随机缩放
翻转、旋转
图像扰动、加噪声、遮挡
改变亮度、对比对、饱和度、色调
随机裁剪(random crop)
随机擦除(random erase)
Cutout
MixUp
CutMix
常见的正则化方法有:
DropOut
DropConnect
DropBlock
平衡正负样本的方法有:
Focal loss
OHEM(在线难分样本挖掘)
除此之外,还有回归 损失方面的改进:
GIOU
DIOU
CIoU
(2)特价包
增大感受野技巧:
SPP
ASPP
RFB
注意力机制:
Squeeze-and-Excitation (SE)
Spatial Attention Module (SAM)
特征融合集成:
FPN
SFAM
ASFF
BiFPN (出自于大名鼎鼎的EfficientDet)
更好的激活函数:
ReLU
LReLU
PReLU
ReLU6
SELU
Swish
hard-Swish
后处理非极大值抑制算法:
soft-NMS
DIoU NMS