数据扩充

最新推荐文章于 2023-12-25 18:02:25 发布

毛毛真nice

最新推荐文章于 2023-12-25 18:02:25 发布

阅读量1.5k

点赞数

分类专栏：卷积神经网络原理专题文章标签：神经网络深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_37554556/article/details/111462366

版权

卷积神经网络原理专题专栏收录该内容

18 篇文章 0 订阅

订阅专栏

数据扩充

简单的数据扩充方式
特殊的数据扩充方式
- Fancy PCA
- 监督式数据扩充

深度卷积网络自身拥有强大的表达能力，不过正因为如此，网络本身需要打咯昂甚至海量的数据来驱动模型训练，否则便有极大可能陷入过拟合的窘境。实际中数据扩充（data augmentation）便成为深度模型训练的第一步。有效的数据扩充不仅能扩充训练样本数量，还能增加训练样本的多样性，一方面可以避免过拟合，另一方面又会带来模型性能的提升。本文介绍目前几种常用有效的数据扩充技巧。

简单的数据扩充方式

在数据扩充方面，简单的方法有图像水平翻转和随机抠取。水平翻转操作会使原数据集扩充一倍。随机抠取操作一般用较大(约0.8至0.9倍原图大小)的正方形在原图的随机位置处抠取图像块，每张图像随机抠取的次数决定了数据扩充的倍数。在此使用正方形的原因是由于卷积神经网络模型的输入一般是方形图像，直接以方形抠取避免了矩形抠取后续的图像拉伸操作带来的分辨率失真。
在这里插入图片描述
除此之外，其他简单的数据扩充方式还有尺度变换、旋转等，从而增加卷积神经网络对物体尺寸和方向上的鲁棒性。尺度变换操作一般是将图像分辨率变为原图的0.8、0.9、1.1-1.3等倍数，将尺度变换后的图像作为扩充的训练样本加入原数据集。旋转操作类似，将原图旋转一定角度，如-30、-15、15、30度等，同样将旋转变换的图像作为扩充样本加入模型训练。
色彩抖动也可以扩充数据，具体操作是对图像的RGB颜色空间对原有的RGB彩色分布进行轻微的扰动。
在实践中，往往会将上述几种方式叠加使用，如此便可将数据扩充至原有数量的数倍甚至数十倍。