YOLOv4
有些特征只在某些模型上运行,针对小规模的数据集,而另外一些特征,适用于大多数的模型,例如规范化操作和残差链接。YOLOv4就是总结了一些小的技巧用于叠加,这里主要提出两个常用的包。
Bag of Freebies:
指的是那些不增加模型复杂度,也不增加推理的计算量的训练方法技巧,来提高模型的准确度
1)数据增强
增加输入图像的可变性,使设计的目标检测模型对不同环境下获取的图像具有更高的鲁棒性
- 像素层面:
光度失真:调整图像的亮度、对比度、色调、饱和度和噪声
几何畸变
加入了随机缩放、裁剪、翻转和旋转 - 遮挡层面:
CutOut,Cutmix,Mosaic
2)网络正则化:Dropout,Dropconnect,Dropblock
3)损失函数:GIOU,DIOU,CIOU
Bag-of-Specials:
指的是那些增加少许模型复杂度或计算量的训练技巧,但可以显著提高模型的准确度
1)增大模型感受野:SPP、ASPP等
2)引入注意力机制:SE、SAM
3)特征集成:PAN,BiFPN
4)激活函数改进:Swish、Mish
5)后处理方法改进:soft NMS、DIoU NMS
CSPNet
CSPNet将数据划分为Part1和Part2两部分,Part2通过Dense Block发送副本到下一阶段,接着将两个分组织的信息在通道方向上进行拼接,且它具有加强CNN学习能力,删除计算瓶颈,减少内存成本的优点。
PAN结构
在FPN结构的基础上增加了从底到顶的信息融合。
YOLOv5
网络结构
类似于Passthrough layer可以在不减少特征信息的情况下,训练的速度更加的快。
将SPP结构转变为SPPF,将两个5x5大小的卷积核串行会形成一个9X9大小的卷积核,但是此时所用的资源会减小