对于一个分类任务,首先要准备好训练集和验证集的文件夹,这两个文件夹存放各种类别的数据图片。
在tf2.x中习惯用高性能的输入数据流水线API:tf.data模块的tf.data.Dataset.from_tensor_slices创建dataset;
在创建dataset前,要准备好训练集和验证集的图片路径数据和标签数据的序列列表,方法如下:
# 训练集图片列表
train_image_list = glob.glob(train_dir + '/*/*.jpg')
random.shuffle(train_image_list)
train_num = len(train_image_list)
# 训练集标签列表