关于Keras 的 ImageDataGenerator 和 Data Augmentation

最新推荐文章于 2021-03-01 21:45:31 发布

Pierce_KK

最新推荐文章于 2021-03-01 21:45:31 发布

阅读量1.7k

点赞数 4

分类专栏： Adrian Rosebrock的blog搬运

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pierce_kk/article/details/98475181

版权

今天的分享是关于如何使用 keras 的 ImageDataGenerator类来进行数据增强处理（data augmentation）。

通过这篇博客你会了解：

什么是数据增强？

为什么我们要使用数据增强？

数据增强的几种常用类型。

什么情况下可以使用，什么情况下不能使用？

1 什么是数据增强

如果你使用过 keras ，那么首先请你来看一下面的这个问题：

以下的选项当中，哪一个是增强处理（data augmentation）这项操作所做的？

添加更多的训练数据（training data）
替换原始的训练数据
二者都有涉及
I don’t know

你默默地选择了哪一项呢？？？

这篇博文的原作者 Adrian Rosebrock 曾经在它的 Twitter 中做过相同的调查，调查的结果如下：

只有 5% 的人选择了 “ 正确 ” 的答案 B ，（这里的正确仅仅是存在于使用 keras 的 ImageDataGenerator class 来进行

数据增强处理的范围内，如果你用的不是keras 的I..D..G..类，那可能 B 项就算不是正确的了，但是在今天的这篇博客

当中，我们仅仅针对 keras 的 ImageDataGenerator 类。）其实它的这个问题并没有表达清楚，如果只是单讲数据增强，

那么前三个选项都是正确的。好了，不要纠结于这个小问题了，它的出现只不过是用于引出我们今天的出题。

到底应当如何来定义 data augment ，要根据你的使用环境来综合考虑。

augment 这个词有 make something ' great ' , or ' increase ' something 的意思，

什么是广义上的数据增强呢？

————它是一种从给定的原始数据当中通过一些图像处理的方法来生成“ 新的 ”训练数据的技巧（techniques），但是要注意的是，生成后的图像要和原图像的 class label 是相同的。

为什么要使用数据增强？

——我们使用数据增强的这个技巧可以增强模型的泛化能力（the generalizability of the model.）

并且 Given that our network is constantly seeing new, slightly modified versions of the input data, the network is able to learn more robust features.

注意：在测试模型的时候我们不针对 test data 使用数据增强，在绝大多数的时候，数据增强的使用是可以增加测试集在

网络模型上的准确度的；但是这也许会在你的训练阶段导致有轻微的在精度上的下降。

针对数据：

下面的两张图是我们随机创建的一些样本点，左侧的数据服从正态分布，

右侧的数据使我们为这个分布添加了一些微小的扰动（jitter），

这种类型的数据增强的应用就能够有效的增加我们网络模型的泛化能力（the generalizability of our networks）。

基于类似于左侧图像的如此标准的数据分布来训练我们的 machine learning model ，也许能够精确的进行建模，

但是这种模型的泛化能力实在是令人堪忧的。况且在真实的世界当中这种如此标注的数据分布是并不多见的，或者说是并不存在的。

为了增强我们分类器的泛化能力，我们人为的为其增加一些大小为e的随机扰动（ randomly jitter ），就有了右侧的分布。

它总体上也是个正态分布，只不过没有左侧的那么标准罢了。

针对图像：

如果换做是将图像作为输入，那么应用数据增强就会生成如下的“ 新图像 ” ，

这种变换只不过是增强方法的一种， we can obtain augmented data from the original images by applying simple geometric transforms, such as random:

Translations
Rotations
Changes in scale
Shearing
Horizontal (and in some cases, vertical) flips

三种常见的数据增强类型

常见的数据增强方式大致可以分为如下的几种：

1. Dataset generation and data expansion via data augmentation (less common)

（通过数据增强来扩展数据集）

2. In-place/on-the-fly data augmentation (most common)

（在训练的时候给模型输入随机变化后的图像，以达到数据增强的目的）

3. Combining dataset generation and in-place augmentation

（两者的结合）

Type #1: Dataset generation and expanding an existing dataset (less common)

第一种类型是使用图像增强方式来扩充我们现有的数据集，但这并不常用，流程如下：

这种形式的数据增强我们一般称其为 dataset generation or dataset expansion.

众所周知，无论是 machine learning 还是 deep learning 都是需要大量的数据集来训练模型的，但是

最低0.47元/天解锁文章

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Pierce_KK CSDN认证博客专家 CSDN认证企业博客

码龄7年

69: 原创

5万+: 周排名

93万+: 总排名

24万+: 访问

: 等级

2586: 积分

78: 粉丝

267: 获赞

66: 评论

1049: 收藏

私信

关注

热门文章

分类专栏

最新评论

HOG特征
翊歌s: 角度应该是arctan(b/a)
HOG特征
Canis_latrans: 同问，这个没搞懂
HOG特征
dh2046: 对于64*128的图像而言，若将Block的滑动步长取为8，那么水平方向将有7个扫描窗口，垂直方向将有15个扫描窗口，。为什么不是水平方向8个，垂直方向16个呢
关于图像分割的评价指标dice
Kyrie_151: 应该是预测对的正例占实际对的所有样本（包含正确预测正例和错误预测反例）
HOG特征
keep learning1: 特征串联是什么意思？假设cell1得到的特征9维特征向量为v1，cell2得到9维特征向量为v2.他们串联起来是不是就是[v1,v2]？

大家在看

最新文章

目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。