主要以Keras的ImageDataGenerator
图像生成器方式讲解如何定义数据集
关于生成器函数的介绍,请参考:https://blog.csdn.net/Forrest97/article/details/106317598
优点:针对大样本的图像数据集,生成器函数可以节约内存资源,在一组epoch中不会出现重复的step数据(待考证)
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import os
import numpy as np
import matplotlib.pyplot as plt
加载一个猫狗的二分类图像数据集到本地
_URL = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'
path_to_zip = tf.keras.utils.get_file('cats_and_dogs.zip', origin=_URL, extract=True)
PATH = os.path.join(os.path.dirname(path_to_zip), 'cats_and_dogs_filtered')
print