(1)flow_from_dataframe函数实例
参考文章
keras中文官方文档flow_from_dataframe()
flow_from_dataframe()
我们需要train训练集图片文件都放在一个文件夹里,
然后csv文件的形式是文件名对应类标签,
然后调用flow_from_dataframe()就可以
- 传入该csv文件名 和 图像所在的文件夹
- 传入x_col: 字符串,dataframe 中包含目标图像文件夹的目录的列。
- y_col: 字符串或字符串列表,dataframe 中将作为目标数据的列。
- subset 在指定了validation的时候使用
- batch_size
- shuffle
- class_mode =“categorical”,
- target_size =(32,32)
开始~
首先,下载数据集并将图像文件保存在单个目录下
例如,我将使用cifar-10数据集
下载并解压缩train.7z和test.7z,将获得 “train”的文件夹和“test”文件夹
下载trainLabels.csv文件,该文件将训练图像的文件名映射到类名
导入包并使用pandas读取CSV文件
from keras.models import Sequential
from keras.preprocessing.image import ImageDataGenerator
from keras.layers import Dense, Activation, Flatten, Dropout, BatchNormalization
from keras.layers import Conv2D, MaxPooling2D
from keras import regularizers, optimizers
import pandas as pd
import numpy as np
def append_ext(fn):
return fn+".png"
traindf=pd.read_csv(“./trainLabels.csv”,dtype=str)
testdf=pd.read_csv("./sampleSubmission.csv",dtype=str)
traindf["id"]=traindf["id"].apply(appe