基于YOLOv5测试图像增强效果。由于发票提取数据仅有1k左右,和数据增强整体效果与各种增强方法效果的不确定性,通过实验确认图像增强效果与增强方法的选定。基本方法是将增强后的图片与标签直接混入原始图像与标签中进行实验。
图像增强方法如下:
- Rotate:小角度旋转
- AddToHueAndSaturation:同时更改色相和饱和度
- WithPolarWarping:极射,类似写轮眼的神威,对图片进行扭曲
- Dropout:随机失活
- BlendAlpha:Alpha融合,不论是在3D还是2D中都常见,最常见的应用就是:设置图片的透明度,不透明度,可以实现抠图。
- AdditiveGaussianNoise:加性高斯白噪声
- 加性指的是叠加在某信号上
- 高斯指的是概率分布里的正态分布函数
- 白噪声指的是它的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性
- 如果这个噪声的幅度服从高斯分布,功率谱密度又是均匀分布的,则称他为高斯白噪声
- Multiply:改变亮度, 不影响bounding box
- Affine:平移后缩放,会影响bounding box
实验思路:综合时间成本等因素,测试8种增加方法。将每一种增强方法与原始图像混合,形成8份增强数据与1份原始数据。对8份增强数据单独训练,比较训练结果,主要是mAP@.5:.95指标,统计优于原始图像的标签项。
在具体实验中的下表(共16个标签),当增强数据mAP@.5:.95>原始数据mAP&