训练第一个神经网络：基础分类——基于TensorFlow_神经网络数据先分类再训练-CSDN博客

本文链接：https://blog.csdn.net/weixin_43763859/article/details/101097690

一、绪论

本节是训练一个神经网络对含有服装的图像进行分类。
这里将用tf.keras,一个高水平的API来建立和训练模型。
一个整体的架构为：
在这里插入图片描述

二、导入相关的库

from __future__ import absolute_import, division, print_function, unicode_literals

# load TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import Keras

# load other necessary liberaries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

三、导入数据集（Fashion MNIST dataset）

这里将用Fashion MNIST dataset，其中包含70，000 张有10个类别的灰阶图像。
我们将用60，000张图像来训练神经网络还有10，000张来评估这个学习分类的神经网络的正确率怎么样。

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
# 在我运行这段代码时始终会报错，后来我上网去查了好久才解决这个问题
# 出现的问题：Compressed file ended before the end-of-stream marker was..
# 解决方案：（windows，我的电脑上是这样操作，大家可以试一试，问题不大）
#在C盘->user->Lenovo->.keras->datasets->fashion-mnist ,将原来的下载的数据解压放进来，将解压包delete，再运行程序就ok

每个图像都匹配一个单一的标记。由于分类的类名没有包含在数据集中，这里将它们存放起来后面将会用到。

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

四、探索数据

在训练数据之前，我们先来探索下数据。这里用60，000张图片用于训练，每张图片用28 * 28 的像素来表示。

train_images.shape

result: (60000， 28， 28)

len(train_labels)

result: 60000

train_labels

result: array([9, 0, 0, . . . , 3, 0, 5], dtype = uint8)

test_images.shape

result: (10000, 28, 28)

len(test_labels)

result: 10000

五、数据预处理

在训练神经网络前，必须要对数据进行预处理。如果你去检查训练集的第一张图片，你会发现像素值的范围是在0~255之间。

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

在这里插入图片描述在将数据喂给神经网络训练之前，我们将这些数据值的范围设置成0~1之间。

train_images = train_images / 255.0
test_images = test_images / 255.0

下面将展示训练集的前25张图片，将每张图片的类名标记在对应图片的下面。

plt.figure(figsize = (10, 10))
for i in range(25):
	plt.subplot(5, 5, i + 1)
	plt.xticks([])
	plt.yticks([])
	plt.grid(False)
	plt.imshow(train_images[i], cmap = plt.cm.binary)
	plt.xlabel(class_names[train_labels[i]])
plt.show()

在这里插入图片描述

六、建立模型

建立神经网络需要配置图层然后编译模型。

（1）设置图层

一个神经网络的基础构建部分就是图层。
许多深度学习由链式图层构成。许多图层，像tf.keras.layers.Dense, 在训练时学习参数。

model = keras.Sequential([
		keras.layers.Flatten(input_shape = (28, 28)),
		keras.layers.Dense(128, activation = tf.nn.relu),
		keras.layers.Dense(10, activation = tf.nn.softmax)
	])

在这里插入图片描述

（2）编译模型

在准备训练模型之前，需要进行少量的设置。需要添加添加一些模型编译的步骤：
（a）损失函数——这可以衡量模型在培训过程中的准确程度。我们希望将此函数最小化以"驱使"模型朝正确的方向拟合。
（b）优化器 —这就是模型根据它看到的数据及其损失函数进行更新的方式。
（c）评价方式 —用于监控训练和测试步骤。以下示例使用准确率(accuracy)，即正确分类的图像的分数。


model.compile(optimizer = 'adam', 
			loss = 'spare_categorical_crossentropy',
			metrics = ['accuracy'])

七、训练模型

训练神经网络需要遵循以下步骤：
（1）将训练集数据喂给模型
（2）模型要学会关联图像和标签
（3）我们需要这个模型在测试集上进行预测

model.fit(train_images, train_labels, epochs = 5)

在这里插入图片描述

八、评估正确率

接下来，比较模型在测试集上的表现

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy: ', test_acc)

在这里插入图片描述

九、做出预测

predictions = model.predict(test_images)