Input 改进点
采用 Mosaic 实现数据增强。
Backbone 改进点
采用 CSPNet(Cross Stage Partial Network)网络结构
用 Concat 代替 Add,提取更丰富的特征。
Concat 操作后,特征图的尺寸不变,深度会增加,而 Add 操作后尺寸和深度都不改变,从这个意义上说,用 Concat 代替 Add,就能够提取更丰富的特征。
引入 transition layer (1 * 1conv + 2 * 2pooling),提取特征,降低计算量,提升速度。11卷积+pooling代替33
用 dropblock 取代 dropout
dropout 缺点:每次训练时随机去掉的神经元可以通过相邻的神经元来预测,因为随着网络层数的增加,神经元之间的相关性是越来越强。
dropblock:每次训练时随机去掉一整片区域,这样就能组合更多不一样的网络,从而表现出更好的泛化作用。
Neck 改进点
yolov3 :简单上采样+concat
yolov4:FPN(Feature pyramid networks) + PANet(Path Aggregation Network)
Head 改进点
用 CIoU Loss 取代 Iou Loss(包括了IOU相同时中心距离的差距,IOU=0时离中心的距离)