一、与yoloV4相比,yoloV5的改进
- 输入端:在模型训练阶段,使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放
- 基准网络:使用了FOCUS结构和CSP结构
- Neck网络:在Backbone和最后的Head输出层之间插入FPN_PAN结构
- Head输出层:训练时的损失函数GIOU_Loss,预测筛选框的DIOU_nms
二、yolov5网络结构
预处理
在模型预处理阶段,使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放
CutMix:将2张图进行拼接
Mosaic:在CutMix基础上进行改进,采用4张图片,按照随机缩放,随机裁剪和随机排布的方式进行拼接
优点:将几张图组合成一张图,不仅可以丰富数据集,极大的提升网络训练速度,降低模型内存
自适应锚框计算(可选)
就是model的y