文章目录项目介绍
划分数据集1、在 dataset 目录下创建三个文件夹
2、将原来 dataset 文件夹中的子文件夹分别复制到这三个文件夹中
3、在 python 中指定所有路径
4、将这三个文件夹中所有子文件夹中的图片删除
5、将 dataset 目录下子文件中的原始图片按比例分到三个文件夹中5.1 划分 96 张图片给 train 文件夹
5.2 划分 32 张图片给 test 文件夹
5.3 划分 32 张图片给 validation 文件夹
导入图片1、构建图片生成器
2、将图片输入图片生成器
训练模型1、构建模型
2、训练模型
3、测试模型
项目介绍
在下载完一个数据集后,很多朋友会为如何划分出训练集、验证集和测试集而烦恼,这篇文章将详细介绍如何划分数据集并将其用于模型训练。
首先,我们的原始数据集如下图所示:
可见这个数据集中共有 28 类。
双击打开其中一类后如图所示:
所以一类中有 160 张图片。
我们的目的是将这些图片按照 6:2:2 的比例分别划分到 train 文件夹、test 文件夹以及 validation 文件夹中,也就是说这三个文件夹中的图片数量分别为 96 个、32 个、32 个。
划分数据集
1、在 dataset 目录下创建三个文件夹
如图所示:
2、将原来 dataset