数据扩充


深度卷积网络自身拥有强大的表达能力,不过正因为如此,网络本身需要打咯昂甚至海量的数据来驱动模型训练,否则便有极大可能陷入过拟合的窘境。实际中数据扩充(data augmentation)便成为深度模型训练的第一步。有效的数据扩充不仅能扩充训练样本数量,还能增加训练样本的多样性,一方面可以避免过拟合,另一方面又会带来模型性能的提升。本文介绍目前几种常用有效的数据扩充技巧。

简单的数据扩充方式

在数据扩充方面,简单的方法有图像水平翻转和随机抠取。水平翻转操作会使原数据集扩充一倍。随机抠取操作一般用较大(约0.8至0.9倍原图大小)的正方形在原图的随机位置处抠取图像块,每张图像随机抠取的次数决定了数据扩充的倍数。在此使用正方形的原因是由于卷积神经网络模型的输入一般是方形图像,直接以方形抠取避免了矩形抠取后续的图像拉伸操作带来的分辨率失真。
在这里插入图片描述
除此之外,其他简单的数据扩充方式还有尺度变换、旋转等,从而增加卷积神经网络对物体尺寸和方向上的鲁棒性。尺度变换操作一般是将图像分辨率变为原图的0.8、0.9、1.1-1.3等倍数,将尺度变换后的图像作为扩充的训练样本加入原数据集。旋转操作类似,将原图旋转一定角度,如-30、-15、15、30度等,同样将旋转变换的图像作为扩充样本加入模型训练。
色彩抖动也可以扩充数据,具体操作是对图像的RGB颜色空间对原有的RGB彩色分布进行轻微的扰动。
在实践中,往往会将上述几种方式叠加使用,如此便可将数据扩充至原有数量的数倍甚至数十倍。

特殊的数据扩充方式

Fancy PCA

这一部分牵涉到符号较多,所以直接截图。
在这里插入图片描述

监督式数据扩充

具体方法是:首先根据原数据训练一个分类的初始模型。而后,利用该模型,对每张图生成对应的特征图或热力图。这张特征图可指示图像区域与场景区域标记间的相关概率。之后,可根据此概率映射回原图选择较强的相关区域作为抠取的图像块。
:文章选自《解析深度学习—卷积神经网络原理与视觉实践》魏秀参著

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

毛毛真nice

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值