YOLOv4 vs. YOLOv5
data augmentation
传统增强+
- CutOut
在CNN第一层随机扔掉某一块 - Hide and seek
- MixUp
按权重把两张图加一起 - CutMix
cutout的区域加入另一张图的目标,应对遮挡问题,识别堆叠的目标物体 - Mosaic马赛克
四张图片随机拼接成大图,缩放识别小物体缓解;batch压力
class label smoothing
引入均匀分布的噪声,平滑label,把类间距离放得更远了(原本只关注类内,不关注类间)
对比
YOLOv3 使用FPN
YOLOv4 使用PAN
使用SPP,(ROI Pooling的前身),但是是针对全图的,且输出三种固定的尺寸(ROI pooling是针对RPN的输出的)
PANNet
FPN特征金字塔;把高分辨率的浅层特征再加到深层部分,增强深层的位置信息(深层本来是丢失很多位置特征的)
CSP Net
网络变小时如何提高学习能力
是DenseNet升级
concat代替resnet中的add操作,特征复用,减少网络结构中的参数。带来的问题是梯度下降时特征重用,学习能力降低
csp解决方式,把每层卷积分成两部分,进行了一些复杂的组合,使梯度组合最大。
Mish激活函数
小于0是更加平滑
YOLOv5 使用
LeakyRelu+Sigmoid激活函数
Dropout更适应于全连接层,对卷积层Dropout影响小。(只去掉一个点,对卷积结果影响较小)
升级为DropBlock,随机对某个区域的2x2都丢弃,(而不是按一个点的随机去丢弃)
各种Loss,以IOU为基础的各种loss
577赞的知乎