1.使用tf.keras.Sequential()搭建一个3层BP神经网络,具体结构如下图:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200309214350163.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyMDQyMTk5,size_16,color_FFFFFF,t_70)
关于softmax函数的具体用法可参考https://blog.csdn.net/bitcarmanlee/article/details/82320853
2.程序编写
导入我们需要用到的库
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
对mnist数据集进行处理,由于手写数字图片的大小为28*28,每个像素值在0-255之间,为方便运算,我们对数据需要进行归一化处理。
# 使python能够正常显示汉字
plt.rcParams["font.sans-serif"] = "SimHei"
# 获得mnist数据集
mnist = tf.keras.datasets.mnist
(train_x, train_y), (test_x, test_y) = mnist.load_data()
# 对数据归一化
train_x = train_x / 255
test_x = test_x / 255
搭建网络模型
# 输入层,将28*28的二维图像展成一维
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
# 隐藏层
model.add(tf.keras.layers.Dense(128, activation='relu'))
# 输出层
model.add(tf.keras.layers.Dense(10, activation='softmax'))
# 损失函数
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['acc'])
模型训练与评估
# 模型训练,迭代5次
model.fit(train_x, train_y, epochs=5)
最后,我们用训练完成的模型对测试集进行预测
# 显示预测结果,n为4的倍数
def show_pic(n):
plt.suptitle("MNIST测试集预测结果", fontsize=20, color="red")
for i in range(n):
num = np.random.randint(1, 10000)
plt.subplot(4, n / 4, i + 1)
plt.axis("off")
plt.imshow(test_x[num], cmap="gray")
plt.title("标签值:" + str(np.argmax(result[num])), fontsize=14)
plt.tight_layout(rect=[0, 0, 1, 0.9])
plt.show()
show_pic(20)