数据增广——图像随机旋转
数据增广是深度学习中常用的一种正则化方法,目的是防止网络过拟合。YOLOv5算法中使用mosaic就是这样一种方法。
图像随机旋转
图像随机旋转是一种常见的数据增广方法,它能够增强网路在各种不同角度分辨物体与非物体的能力。现实世界里,目标物体可能以各种神奇的角度出现,例如无人机在拍摄船舶时可能发生自转,导致目标在相邻帧发生旋转。如果在训练时不加以考虑,那网络可能出现漏识别或者误识别等问题。我在训练YOLOv5时就碰到了这样的问题。
使用没有随机旋转的数据集训练YOLOv5,测试时会出现将非目标物体识别成目标物体的现象。Like this. 出现了!!!左上角把山脉和云朵合并识别成船舶的经典错误案例!呜呜呜!大哥,你置信度给的可比人家正经船只高很多了,超过90%呢。
However,当我在训练时随机旋转batch中的图片,最后训练出来的网络就能够避免将这种非船舶目标识别成船舶目标的现象,like this. 好欸!!!!这样我们就知道在训练时加入随机旋转的确是有用的呢!Good!