一、绪论
本节是训练一个神经网络对含有服装的图像进行分类。
这里将用tf.keras,一个高水平的API来建立和训练模型。
一个整体的架构为:
二、导入相关的库
from __future__ import absolute_import, division, print_function, unicode_literals
# load TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import Keras
# load other necessary liberaries
import numpy as np
import matplotlib.pyplot as plt
print(tf.__version__)
三、导入数据集(Fashion MNIST dataset)
这里将用Fashion MNIST dataset,其中包含70,000 张有10个类别的灰阶图像。
我们将用60,000张图像来训练神经网络还有10,000张来评估这个学习分类的神经网络的正确率怎么样。
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
# 在我运行这段代码时始终会报错,后来我上网去查了好久才解决这个问题
# 出现的问题:Compressed file ended before the end-of-stream marker was..
# 解决方案:(windows,我的电脑上是这样操作,大家可以试一试,问题不大)
#在C盘->user->Lenovo->.keras->datasets->fashion-mnist ,将原来的下载的数据解压放进来,将解压包delete,再运行程序就ok
每个图像都匹配一个单一的标记。由于分类的类名没有包含在数据集中,这里将它们存放起来后面将会用到。
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
四、探索数据
在训练数据之前,我们先来探索下数据。这里用60,000张图片用于训练,每张图片用28 * 28 的像素来表示。
train_images.shape
result: (60000, 28, 28)
len(train_labels)
result: 60000
train_labels
result: array([9, 0, 0, . . . , 3, 0, 5], dtype = uint8)
test_images.shape
result: (10000, 28, 28)
len(test_labels)
result: 10000
五、数据预处理
在训练神经网络前,必须要对数据进行预处理。如果你去检查训练集的第一张图片,你会发现像素值的范围是在0~255之间。
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()
在将数据喂给神经网络训练之前,我们将这些数据值的范围设置成0~1之间。
train_images = train_images / 255.0
test_images = test_images / 255.0
下面将展示训练集的前25张图片,将每张图片的类名标记在对应图片的下面。
plt.figure(figsize = (10, 10))
for i in range(25):
plt.subplot(5, 5, i + 1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(train_images[i], cmap = plt.cm.binary)
plt.xlabel(class_names[train_labels[i]])
plt.show()
六、建立模型
建立神经网络需要配置图层然后编译模型。
(1)设置图层
一个神经网络的基础构建部分就是图层。
许多深度学习由链式图层构成。许多图层,像tf.keras.layers.Dense, 在训练时学习参数。
model = keras.Sequential([
keras.layers.Flatten(input_shape = (28, 28)),
keras.layers.Dense(128, activation = tf.nn.relu),
keras.layers.Dense(10, activation = tf.nn.softmax)
])
(2)编译模型
在准备训练模型之前,需要进行少量的设置。需要添加添加一些模型编译的步骤:
(a)损失函数——这可以衡量模型在培训过程中的准确程度。 我们希望将此函数最小化以"驱使"模型朝正确的方向拟合。
(b)优化器 —这就是模型根据它看到的数据及其损失函数进行更新的方式。
(c) 评价方式 —用于监控训练和测试步骤。以下示例使用准确率(accuracy),即正确分类的图像的分数。
model.compile(optimizer = 'adam',
loss = 'spare_categorical_crossentropy',
metrics = ['accuracy'])
七、训练模型
训练神经网络需要遵循以下步骤:
(1)将训练集数据喂给模型
(2)模型要学会关联图像和标签
(3)我们需要这个模型在测试集上进行预测
model.fit(train_images, train_labels, epochs = 5)
八、评估正确率
接下来,比较模型在测试集上的表现
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy: ', test_acc)
九、做出预测
predictions = model.predict(test_images)