首先MNIST是一个非常有名的手写字体数字识别数据集,Tensorflow对这个数据集进行了封装,让其使用起来更加方便。MNIST数据集是NIST数据集的一个子集,它包含了60000张图片作为训练集,10000张图片作为测试集。每一张图片都代表了0-9中的一个数字。图片的大小都是28x28,且数字都会出现在图片正中间。
为了方便使用,Tensorflow提供了一个类来处理MNIST数据。这个类会自动下载并转化MNIST数据格式,将数据从原始的数据包中解析成训练和测试神经网络时使用的格式,样例程序如下:
from tensorflow.examples.tutorials.mnist import input_data
mnist=input_data.read_data_sets("/path/to/MNIST_data/",one_hot=True)
print("Training data size:",mnist.train.num_examples)
print("Validating data size:",mnist.validation.num_examples)
print("Testing data size:",mnist.test.num_examples)
print("Example training data:",mnist.train.images[0])
print("Example training data label:",mnist.train.labels[0])