5.1 MNIST数据集简介
MNIST数据集为深度学习入门样例,由Yann LeCun创建,并且已经完成了图片的预处理,该数据集包含下面信息
- 下载网址: http://yann.lecun.com/exdb/mnist/
- MNIST数据包含6000张训练数据,10000张测试数据
- 每张图片的大小为28*28
目前tensorflow已经封装了下载接口,
print("---------------------Introduction to MNIST--------------------")
import tensorflow as tf
from matplotlib import pyplot as plt
(x_train, y_train), (x_test, y_test) = \
tf.keras.datasets.mnist.load_data(path='/home/ponyai/liangsun/3_learning_tensorflow/chapter_5/mnist')
Training size: 60000, Test size: 10000, image shape: (28, 28)
print('Training size: {}, Test size: {}, image shape: {}'.
format(x_train.shape[0], x_test.shape[0], x_train[0].shape))
fig, axs = plt.subplots(3, 3)
fig.suptitle('9 images in mnist')
for i in range(3):
for j in range(3):
axs[i][j].set_title(y_train[3 * i + j])
axs[i][j].imshow(x_train[3 * i + j])
plt.show()
5.2 MNIST数据各个model已经达到的错误率
SVM, 最右列为在测试样本上的错误率, 最佳的model错误率为0.56%
NN, 最佳的model,错误率为0,35%
CNN,最佳错误率为0.23%,相当于在测试集上,总共错了23张图片。