数据预处理（常用增强技术）

最新推荐文章于 2024-05-13 20:47:46 发布

William_Yue91

最新推荐文章于 2024-05-13 20:47:46 发布

阅读量1k

点赞数

分类专栏：数据预处理

数据预处理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

参考文献：Data Augmentation | How to use Deep Learning when you have Limited Data
author网址：https://thatbrguy.github.io/
参考网址1：http://baijiahao.baidu.com/s?id=1599775088482026500&wfr=spider&for=pc
参考网址2：https://www.jianshu.com/p/99450dbdadcf

翻转：水平翻转，垂直翻转
旋转：在旋转之后，图像大小（维度）可能会改变。如果是正方型图像，旋转任意90度之后图像的尺寸会被保留。如果图像是长方形，旋转180度之后图像尺寸也会保留。但用更小的角度旋转图像，将会改变最终图像的尺寸。
缩放：图像可以被放大或缩小。图像放大后，大多数图像处理架构会按照原始尺寸对放大后的图像进行裁切。图像缩小后，会减小图像尺寸，这使我们不得不对图像边界之外的东西做出假设。
裁剪：随机从原始图像中采样一部分。然后将这部分图像调整为原始图像大小。这个方法更流行的叫法是随机裁剪。
平移：是将图像沿X或Y方向（或者同时沿2个方向）移动。这一数据增强方法非常有用，因为大多数对象有可能分布在图像的任何地方。这迫使你的卷积神经网络需要看到所有地方。
高斯噪声：过拟合（Overfitting）经常会发生在神经网络试图学习高频特征（即非常频繁出现的无意义模式）的时候，而学习这些高频特征对模型提升没什么帮助。如何处理？
一个是采用具有零均值特性的高斯噪声，它实质上在所有频率上都能产生数据点，可以有效的使高频特征失真，减弱其对模型的影响。但这也意味着低频的成分（通常是你关心的特征）同时也会受到影响，但是神经网络能够通过学习来忽略那些影响。事实证明，通过添加适量的噪声能够有效提升神经网络的学习能力。
一个是椒盐噪声，它以随机的白色和黑色像素点呈现并铺满整个图片。这种方式对图像产生的作用和添加高斯噪声产生的作用是一样的，只是效果相对较弱。

填充边界方式：

常量填充：最简单的插值方法是用某个常量值填充未知区域。这可能不适用于自然图像, 但可以用于在单色背景下拍摄的图像。
边缘扩展：将图像边缘的值扩展到边界以外。
反射：图像像素值沿图像边界进行反射。这种方法对于包含树木、山脉等的连续或自然背景是有用的。
对称：此方法类似于反射，除了在反射边界上进行边缘像素拷贝。通常，反射和对称可以交替使用，但在处理非常小的图像或图案时，差异将是可见的。
包裹：在超出图像边界的部分重复填充图像，仿佛在进行图像平铺。这种方法不像其他的那样普遍使用，因为它对很多场景都没有意义。
除此之外，你还可以设计自己的方法来处理未定义的空间，但通常以上这些方法对大多数分类问题都有很好的效果。

William_Yue91

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数据预处理（常用增强技术）

参考文献：Data Augmentation | How to use Deep Learning when you have Limited Dataauthor网址：https://thatbrguy.github.io/参考网址1：http://baijiahao.baidu.com/s?id=1599775088482026500&wfr=spider&for=pc参...
复制链接

扫一扫

专栏目录