我们可以直接使用ImageDataGenerator函数中的validation_split这个参数直接将数据集划分为训练集和验证集。他允许我们从数据集中随机生成作为训练集和验证集的子集,并且根据自己的需要去调整比例。
TRAIN_DIR = './datasets/training'
datagen = ImageDataGenerator(validation_split=0.3, rescale=1./255)
当我们在调用flow_from_directory的时候,我们要通过subset来选择训练集和验证集。
train_generator = datagen.flow_from_directory(
TRAIN_DIR,
subset='training'
)
val_generator = datagen.flow_from_directory(
TRAIN_DIR,
subset='validation'
)