MNIST数据集
MNIST是一个手写体数字识别数据体,作为机器学习的入门样例。这个数据集包含了60000张图片作为训练数据,其中图片的大小为28*28。一般从中划出5000张作为验证数据(validation),另外55000张作为训练数据(train),还有10000张图片作为测试数据(test),且每一张图片都代表了0-9中的一个数字。在TF中专门提供了一个类来处理MNIST数据:
from tensorflow.examples.tutorials.mnist import input_data
#载入MNIST数据集,如果MNIST_data文件夹中无数据,则自动从网上下载
mnist = input_data.read_data_sets("MNIST_data", one_hot=True)
print("Training data size:", mnist.train.num_examples)
#Training data size: 55000
print("Validating data size:", mnist.validation.num_examples)
#Validating data size: 5000
print("Testing data size:", mnist.test.num_examples)
#Testing data size: 10000
print("Example training data:", mnist.train.images[0])
#Example training data:[0. 0. 0. 0. 0. ... 0. 0.365 0. ...] 共784项
print("Example training data label:", mnist.t