本文主要是介绍基于mnist数据集的手写数字识别.
一 数据集
mnist 数据集:包含 7 万张黑底白字手写数字图片, 其中 55000 张为训练集,5000 张为验证集, 10000 张为测试集。每张图片大小为 28*28 像素,图片中纯黑色像素值为 0, 纯白色像素值为 1。数据集的标签是长度为 10 的一维数组,数组中每个元素索引号表示对应数字出现的概率。在将 mnist 数据集作为输入喂入神经网络时,需先将数据集中每张图片变为长度784 一维数组,将该数组作为神经网络输入特征喂入神经网络。
1. 使用tensorflow提供的数据集mnist,具体的加载方法为:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data(data_path,one_hot=True)
2. 数据集分为train,validation,test三个数据集.
① 返回数据集train样本数 mnist.train.num_examples
② 返回数据集validation样本数 mnist.validation.num_examples
③ 返回数据集test样本数 mnist.test.num_examples
3. 使用mnist.train.images