深度学习流程（一）之数据预处理

最新推荐文章于 2023-07-14 15:09:30 发布

PhenomenonMe

最新推荐文章于 2023-07-14 15:09:30 发布

阅读量1k

点赞数

分类专栏：笔记文章标签：深度学习

本文链接：https://blog.csdn.net/firehuiplane/article/details/118313278

版权

本文介绍了深度学习中数据增强的重要性，包括有监督的数据增强（单样本与多样本），如几何变换、颜色变换，以及无监督的数据增强方法如GAN和Autoaugment。此外，还讨论了如何应对样本不均衡问题，提出了欠采样、过采样、阈值移动、改变数据权值等策略。

摘要由CSDN通过智能技术生成

一. 数据增强的策略

数据增强也叫数据扩增，意思是在不实质性的增加数据的情况下，让有限的数据产生等价于更多数据的价值，从而获得更好的多样性，这就是数据增强的本质。

数据增强可以分为，有监督的数据增强和无监督的数据增强方法。其中有监督的数据增强又可以分为单样本数据增强和多样本数据增强方法，无监督的数据增强分为生成新的数据和学习增强策略两个方向。

有监督数据增强，即采用预设的数据变换规则，在已有数据的基础上进行数据的扩增，包含单样本数据增强和多样本数据增强，其中单样本又包括几何操作类，颜色变换类。

所谓单样本数据增强，即增强一个样本的时候，全部围绕着该样本本身进行操作，包括几何变换类，颜色变换类等。

（1）几何变换

几何变换类即对图像进行几何变换，包括翻转，旋转，裁剪，变形，缩放等各类操作。

翻转操作和旋转操作，对于那些对方向不敏感的任务，比如图像分类，都是很常见的操作，在caffe等框架中翻转对应的就是mirror操作。

翻转和旋转不改变图像的大小，而裁剪会改变图像的大小。通常在训练的时候会采用随机裁剪的方法，在测试的时候选择裁剪中间部分或者不裁剪。值得注意的是，在一些竞赛中进行模型测试时，一般都是裁剪输入的多个版本然后将结果进行融合，对预测的改进效果非常明显。

以上操作都不会产生失真，而缩放变形则是失真的。很多的时候，网络的训练输入大小是固定的，但是数据集中的图像却大小不一，此时就可以选择上面的裁剪成固定大小输入或者缩放到网络的输入大小的方案，后者就会产生失真，通常效果比前者差。

（2）颜色变换

上面的几何变换类操作，没有改变图像本身的内容，它可能是选择了图像的一部分或者对像素进行了重分布。如果要改变图像本身的内容，就属于颜色变换类的数据增强了，常见的包括噪声、模糊、颜色变换、擦除、填充等等。

基于噪声的数据增强就是在原来的图片的基础上，随机叠加一些噪声，最常见的做法就是高斯噪声。更复杂一点的就是在面积大小可选定、位置随机的矩形区域上丢弃像素产生黑色矩形块，从而产生一些彩色噪声，以Coarse Dropout方法为代表，甚至还可以对图片上随机选取一块区域并擦除图像信息。

颜色变换的另一个重要变换是颜色扰动，就是在某一个颜色空间通过增加或减少某些颜色分量，或者更改颜色通道的顺序。

不同于单样本数据增强，多样本数据增强方法利用多个样本来产生新的样本，下面介绍几种方法。

（1）SMOTE

SMOTE 即 Synthetic Minority Over-sampling Technique 方法，它是通过人工合成新样本来处理样本不平衡问题，从而提升分类器性能。

SMOTE方法是基于插值的方法，它可以为小样本类合成新的样本，主要流程为：

定义好特征空间，将每个样本对应到特征空间中的某一点，根据样本不平衡比例确定好一个采样倍率N
对于每一个小样本类的样本 $(x, y)$ ，按照欧式距离找出 $K$ 个最近邻样本，从中随机选取一个样本点。假设选择的近邻点为 $x_n,y_n)$ ，在特征空间中样本点与最近邻样本点的连线段上随机选取一点作为新的样本点。 $x_{new},y_{new})=(x,y)+rand(0,1)*((x_n-x),(y_n-y))$

关注