深度学习算法数据预处理之数据增强基础

最新推荐文章于 2024-07-06 21:27:32 发布

uu无极

最新推荐文章于 2024-07-06 21:27:32 发布

阅读量2.7k

点赞数 1

分类专栏：深度学习算法图像处理准备文章标签：深度学习

本文链接：https://blog.csdn.net/qq_35345719/article/details/105900328

版权

数据增强通过裁剪、旋转、缩放等操作在原始数据上生成更多等价数据，提高深度学习模型的多样性。包括有监督的单样本和多样本增强，如几何和颜色变换，以及无监督的数据增强，如GAN和AutoAugment。此类技术有助于解决样本不平衡问题，提升模型性能和泛化能力。

摘要由CSDN通过智能技术生成

数据增强也叫做数据扩增，就是在不实质上增加原始数据量的情况下，通过裁剪、旋转、缩放、对称等操作，在原有数据上产生更多的等价数据量作为深度学习的数据集。比如裁剪：对于一张256*256的图，裁剪成224*224的图片，可以产生32*32张不同的图片，数据量近似扩充了1000倍（实际情况可能因为图片相似度过高，打些折扣），如果再辅以其他手段，就会有更好的多样性。

数据增强可以分为：有监督的数据增强（又分为单样本和多样本的数据增强方法）和无监督的数据增强（分为生成新的数据和学习增强策略两个方向）。

一、有监督的数据增强

（1）有监督的数据增强，即需要有特定的数据变换规则，对于单样本，可以进行：几何变换类，如翻转（水平、垂直）、旋转（随机）、裁剪（随机）、变形、缩放等操作；颜色变换类，如噪声、模糊、颜色扰动、擦除、填充等。

需要注意的是：1）对于翻转和旋转操作，经常用于对方向不敏感的任务，比如图像分类。裁剪会改变图片的大小，缩放变形会使图片失真。2）通常情况下，网络的训练要求输入的大小固定，当数据集中的图像大小不一时，可以选择裁剪或缩放至网络要求的固定大小的方式，后者因为有失真，效果通常会比前者差。

基于噪声的数据增强就是在原来的图片基础上，随机叠加一些噪声，常用的如高斯噪声，也可以在面积大小选定、位置随机的矩形区域上去除像素产生黑色矩形框，从而产生一些彩色噪声，以Coarse Dropout方法