V3-Ultralytics
YoloV3:an incremental improvement - SPP -ultralytics
Mosaic图像增强
图像增强原来采用随机裁剪、翻转、色彩等方法;
Mosaic图像通过将4个图像拼接组合作为新的图片输入;
可以实现增强数据多样性、增加目标个数、BN可统计一次性多张图片的参数(采用BN时,batch-size越大越好,因为可以让整体的数据处于均值为0,方差为1的情况下)(这里相当于采用batch-size=4的情况)
SPP与SPPF模块
SPP的概念和功能
SPP结构,实现不同尺度的特征融合;
(Padding=1,Stride=1的Maxpool不改变图像大小)
上图是SPP与SPPF的原理
SPP与SPPF的区别:
SPPF要比SPP更加快,因为省去了部分的计算过程;
SPP是每个通道单独计算;
SPPF是,用初始的计算5 * 5,然后用5 * 5计算9 * 9以此类推
(ps:添加一个SPP结构在主干上,相对于添加3个SPP结构性价比更高)
Loss
IoU Loss
GIoU Loss
u 是并集面积;
Ac是覆盖这两个框的最小矩形;
缺点:处于水平或垂直情况
DIoU
CIoU
Focal Loss
使用后mAP降低了;
Focal Loss针对one-stage object detection model;
主要面对正负样本不平衡问题;
引入一个超参数概率,调整正负样本数据对应的权重;
但是无法区分容易样本、困难样本;
引入 γ 降低容易区分的样本的损失贡献;
最终:
在阿尔法和伽马取2.0 0.25
的时候效果取得最好的;
可能需要多次调参,否则Focal loss可能没有原来的效果好;