一、训练之前数据的预处理主要包括两个方面
1、将图片数据统一格式,以标签来命名并存到train文件夹中(假设原始图片按类别存到文件夹中)。
2、对命名好的图片进行训练集和测试集的划分以及图片数据化。
先对整个项目文件进行说明:
image文件里是用来对模型测试的未处理图片(训练模型不用)。
logs文件存放训练好的模型。
prediction文件是image文件中图片经过模型测试后分类的图片。
train文件有两个文件子层orig_data和train_data,前一个是未处理训练模型图片,后一个是处理好的进行模型训练的图片。
.py文件是项目程序,其他项目自带的,无关。
二、OK!现在先进行第一步,新建IntputData.py文件
import os
from PIL import Image
#未处理图片位置
orig_picture = r'E:\PycharmPython\NewCnn\train\orig_data'
#已处理图片存储位置
gen_picturn = r'E:\PycharmPython\NewCnn\train\train_data'
#查询需要分类的类别以及总样本个数
classes = []
num_sa