keras中ImageDataGenerator用法

最新推荐文章于 2023-04-27 11:37:05 发布

babywang0

最新推荐文章于 2023-04-27 11:37:05 发布

阅读量2.2k

点赞数

分类专栏：计算机视觉笔记

计算机视觉笔记专栏收录该内容

8 篇文章

订阅专栏

摘自：https://blog.csdn.net/u012969412/article/details/76796020
https://www.jianshu.com/p/d23b5994db64
keras函数官方解析连接：http://keras-cn.readthedocs.io/en/latest/preprocessing/image/

ImageDataGenerator()是keras.preprocessing.image模块中的图片生成器，用以生成一个batch的图像数据，支持实时数据提升。训练时该函数会无限生成数据，直到达到规定的epoch次数为止。同时也可以在batch中对数据进行增强，扩充数据集大小，增强模型的泛化能力。比如进行旋转，变形，归一化等等。

keras.preprocessing.image.ImageDataGenerator(
	featurewise_center=False,     #布尔值，使输入数据集去中心化（均值为0）, 按feature执行。即对输入的图片每个通道减去每个通道对应均值。
    samplewise_center=False,     #布尔值，使输入数据的每个样本均值为0。即令每张图片减去样本均值。
    featurewise_std_normalization = False,   #布尔值，将输入除以数据集的标准差以完成标准化, 按feature执行。
    samplewise_std_normalization = False,   #布尔值，将输入的每个样本除以其自身的标准差。
    zca_whitening = False,       #布尔值，对输入数据施加ZCA白化。去除样本之间的相关性
    zca_epsilon(): Default 12-6
    rotation_range = 0.,            #整数，数据提升时图片随机转动的角度。随机选择图片的角度，是一个0~180的度数，取值为0~180。
    width_shift_range = 0.,       #浮点数，图片宽度的某个比例，数据提升时图片随机水平偏移的幅度。取值0～1。
    height_shift_range = 0.,      #浮点数，图片高度的某个比例，数据提升时图片随机竖直偏移的幅度。取值0～1。
    shear_range = 0.,                #浮点数，剪切强度(逆时针方向的剪切变换角度)。是用来进行剪切变换的程度。
    zoom_range = 0.,                #浮点数或形如[lower,upper]的列表，随机缩放的幅度。[lower,upper] = [1 - zoom_range, 1+zoom_range]。
    channel_shift_range = 0.,   #浮点数，随机通道偏移的幅度。
    fill_mode = 'nearest',          #‘constant’，‘nearest’，‘reflect’或‘wrap’之一，当进行变换时超出边界的点将根据本参数给定的方法进行处理
    cval = 0.0,                           #浮点数或整数，当fill_mode=constant时，指定要向超出边界的点填充的值。
    horizontal_flip = False,       #布尔值，进行随机水平翻转。随机的对图片进行水平翻转，这个参数适用于水平翻转不影响图片语义的时候。
    vertical_flip = False,            #布尔值，进行随机竖直翻转。
    rescale = None,                   #值将在执行其他处理前乘到整个图像上，我们的图像在RGB通道都是0～255的整数，这样的操作可能使图像的值过高或过低，所以我们将这个值定为0～1之间的数。
    preprocessing_function = None,             #将被应用于每个输入的函数。该函数将在任何其他修改之前运行。该函数接受一个参数，为一张图片（秩为3的numpy array），并且输出一个具有相同shape的numpy array
    data_format = K.image_data_format(),   #字符串，“channel_first”或“channel_last”之一，代表图像的通道维的位置。该参数是Keras 1.x中的image_dim_ordering，“channel_last”对应原本的“tf”，“channel_first”对应原本的“th”。以128x128的RGB图像为例，“channel_first”应将数据组织为（3,128,128），而“channel_last”应将数据组织为（128,128,3）。该参数的默认值是~/.keras/keras.json中设置的值，若从未设置过，则为“channel_last”。
)

例子：

train_datagen = ImageDataGenerator(
    preprocessing_function = preprocess_input,
    rotation_range = 30,
    width_shift_range = 0.2,
    height_shift_range = 0.2,
    shear_range = 0.2,
    zoom_range = 0.2,
    horizontal_flip = True,
)

摘自：https://blog.csdn.net/C_chuxin/article/details/84573457

shear_range

shear_range就是错切变换，效果就是让所有点的x坐标(或者y坐标)保持不变，而对应的y坐标(或者x坐标)则按比例发生平移，且平移的大小和该点到x轴(或y轴)的垂直距离成正比。具体效果见上文链接。

zoom_range

zoom_range参数可以让图片在长或宽的方向进行放大，可以理解为某方向的resize，因此这个参数可以是一个数或者是一个list。当给出一个数时，图片同时在长宽两个方向进行同等程度的放缩操作；当给出一个list时，则代表[width_zoom_range, height_zoom_range]，即分别对长宽进行不同程度的放缩。而参数大于0小于1时，执行的是放大操作，当参数大于1时，执行的是缩小操作。

fill_mode

fill_mode为填充模式，如前面提到，当对图片进行平移、放缩、错切等操作时，图片中会出现一些缺失的地方，那这些缺失的地方该用什么方式补全呢？就由fill_mode中的参数确定，包括：“constant”、“nearest”（默认）、“reflect”和“wrap”。这四种填充方式的效果对比如图18所示，从左到右，从上到下分别为：“reflect”、“wrap”、“nearest”、“constant”。