模型采用两层卷积、两层池化、以及一个普通的MLP进行搭建。
训练数据为8000张图片,输入大小为(5050)以提高模型的训练速度。
由于模型搭建比较简单,最终的在测试数据上面的测试效果不是很好,准确率只有70%。
为了提高模型的表现,使用VGG16模型提取图片的重要特征点,再创建一个MLP模型进行预测,最终测试效果也达到了90%。*
导入相关包
# 数据载入
from keras.preprocessing.image import ImageDataGenerator
# 加载可视化包
from matplotlib import pyplot as plt
# 线性模型
from keras.models import Sequential
from keras.layers import Dense,Conv2D,MaxPool2D,Flatten
加载数据
# 加载数据集并进行归一化处理,图片大小为(50*50),分批次进行加载,每次加载32张图片
train_datagen = ImageDataGenerator(rescale=1. / 255)
train_set = train_datagen.flow_from_directory('./training_set', target_size=(50, 50), batch_size=32, class_mode='binary')
查看数据相关信息
# print(type(train_set))
# print(train_set.batch_size)
# print(train_set.filenames)
# print(train_set.class_indices)
# print(train_set[0][0][0])
可视化数据
# fig = plt.figure()
# 第一批次的第一张图片的x信息
# plt.imshow(train_set[0][0][0])
# plt.show()
建立CNN模型
# 建立CNN模型 顺序模型
model_cnn = Sequential()
# 添加卷积层
model_cnn.add(Conv2D(32, (3, 3),input_shape=(50, 50, 3), activation='relu'))
# 池化层
model_cnn.add(MaxPool2D(pool_size=(2, 2)))
# 添加卷积层
model_cnn.add(Conv2D(32, (3, 3),input_shape=(50, 50, 3), activation='relu'))
# 池化层
model_cnn.add(MaxPool2D(pool_size=(2, 2)))
模型配置
# 将矩阵展开以适合模型的输入
model_cnn.add(Flatten())
# 全连接层
model_cnn.add(Dense(units=128, activation='relu'))
model_cnn.add(Dense(units=1, activation='sigmoid'))
# 模型配置
model_cnn.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
# model_cnn.summary()
模型训练并存储
# 模型训练次数为20次,并保存在当前文件夹下的model_cnn.h5
model_cnn.fit_generator(train_set, epochs=20)
model_cnn.save('model_cnn.h5')
计算模型准确率
# 计算模型在训练集上的准确率,方便对模型进行评估优化
accuracy_train = model.evaluate_generator(train_set)
print(accuracy_train)