读书笔记（一） Keras MNIST手写数字识别数据-CSDN博客

本文链接：https://blog.csdn.net/bboyliang67/article/details/104082880

《TensorFlow+Keras深度学习人工智能实践应用》读书笔记

选择MNIST手写数据识别数据集是因为其数据量不多，而且是单色的图像，比较简单，很适合自己这种初学者用来练习建立模型、训练、预测。
MNIST数据集共有数据项60000项、测试数据10000项。MNIST数据集中的每一项数据都由images(数字图像)与label(真实的数字)所组成。

一、下载MNIST数据集

导入Kears及相关模块

import numpy as np        //导入numpy模块，numpy支持维数组与矩阵运算
import pandas as pd       
from keras.utils import np_utils     //导入keras.utils是为了后续要将label标签转换为One-Hot Encoding（一位有效编码）
np.random.seed(10)      //设置seed可以产生的随机数据

运行结果会显示Using Tensorflow backend表示Keras自动以TensorFlow作为Backend。

导入Keras模块
由于Keras已经提供了现成的模块可以帮助我们下载并读取MNIST数据，所以先导入MNIST模块。

from keras.datasets import mnist

第一次进行MNIST数据的下载

(x_train_image, y_train_label),\
(x_test_image, y_test_label) = mnist.load_data()

第一次执行mnist.load()方法时，程序会检查用户目录下是否有MNIST数据集，如果没有，就会下载文件，所以运行时间比较长。

查看MNIST数据

print('train data=',len(x_train_image))
print('test data=',len(x_test_image))

运行结果为train data=60000,test data=10000
即数据分为两部分：train训练数据60000项，test测试数据10000项。

二、查看训练数据

训练数据是由images与labels组成的

print('x_train_image:',x_train_image.shape)
print