数据增强(图像)初探

本文探讨了数据增强在图像识别任务中的作用,特别是针对YOLOv5模型。通过实验,作者对比了多种图像增强技术,如旋转、色相饱和度调整、极射扭曲等,对模型性能的影响。实验结果显示,旋转、随机失活和仿射变换对目标检测的mAP@.5:.95指标有显著提升。经过进一步的训练和混合增强数据,证实了数据增强对于提高模型性能的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于YOLOv5测试图像增强效果。由于发票提取数据仅有1k左右,和数据增强整体效果与各种增强方法效果的不确定性,通过实验确认图像增强效果与增强方法的选定。基本方法是将增强后的图片与标签直接混入原始图像与标签中进行实验。

图像增强方法如下:

  • Rotate:小角度旋转
  • AddToHueAndSaturation:同时更改色相和饱和度
  • WithPolarWarping:极射,类似写轮眼的神威,对图片进行扭曲
  • Dropout:随机失活
  • BlendAlpha:Alpha融合,不论是在3D还是2D中都常见,最常见的应用就是:设置图片的透明度,不透明度,可以实现抠图。
  • AdditiveGaussianNoise:加性高斯白噪声
    • 加性指的是叠加在某信号上
    • 高斯指的是概率分布里的正态分布函数
    • 白噪声指的是它的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性
    • 如果这个噪声的幅度服从高斯分布,功率谱密度又是均匀分布的,则称他为高斯白噪声
  • Multiply:改变亮度, 不影响bounding box
  • Affine:平移后缩放,会影响bounding box

实验思路:综合时间成本等因素,测试8种增加方法。将每一种增强方法与原始图像混合,形成8份增强数据与1份原始数据。对8份增强数据单独训练,比较训练结果,主要是mAP@.5:.95指标,统计优于原始图像的标签项。

在具体实验中的下表(共16个标签),当增强数据mAP@.5:.95>原始数据mAP&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值