《TensorFlow+Keras深度学习人工智能实践应用》读书笔记
选择MNIST手写数据识别数据集是因为其数据量不多,而且是单色的图像,比较简单,很适合自己这种初学者用来练习建立模型、训练、预测。
MNIST数据集共有数据项60000项、测试数据10000项。MNIST数据集中的每一项数据都由images(数字图像)与label(真实的数字)所组成。
一、下载MNIST数据集
- 导入Kears及相关模块
import numpy as np //导入numpy模块,numpy支持维数组与矩阵运算
import pandas as pd
from keras.utils import np_utils //导入keras.utils是为了后续要将label标签转换为One-Hot Encoding(一位有效编码)
np.random.seed(10) //设置seed可以产生的随机数据
运行结果会显示Using Tensorflow backend
表示Keras自动以TensorFlow作为Backend。
- 导入Keras模块
由于Keras已经提供了现成的模块可以帮助我们下载并读取MNIST数据,所以先导入MNIST模块。
from keras.datasets import mnist
- 第一次进行MNIST数据的下载
(x_train_image, y_train_label),\
(x_test_image, y_test_label) = mnist.load_data()
第一次执行mnist.load()方法时,程序会检查用户目录下是否有MNIST数据集,如果没有,就会下载文件,所以运行时间比较长。
- 查看MNIST数据
print('train data=',len(x_train_image))
print('test data=',len(x_test_image))
运行结果为train data=60000,test data=10000
即数据分为两部分:train训练数据60000项,test测试数据10000项。
二、查看训练数据
- 训练数据是由images与labels组成的
print('x_train_image:',x_train_image.shape)
print