MNIST是一个非常有名的手写体数字识别数据集,是NIST数据集的一个子集,它包含60000张图片作为训练数据,10000张图片作为测试数据。
对于MINIST的详细介绍可以在Yann LeCun教授的网站中看到,同时可以在该网站上下载该数据集,也可以通过下面的方法下载数据集。
import tensorflow as tf
print(tf.__version__)
from tensorflow.examples.tutorials.mnist import input_data
# 载入数据集,如果在指定路径(下面的路径为project工作环境所在的文件夹下的datasets/MNIST_data/)没有下载好的数据,那么tensorflow将自动从上面那个网站下载
mnist = input_data.read_data_sets("./datasets/MNIST_data/", one_hot=True)
print("Training data size: ", mnist.train.num_examples)
print("Validating data size: ", mnist.validation.num_examples)
print("Testing data size: ", mnist.test.num_examples)
输出如下
1.4.0
Extracting ./datasets/MNIST_data/train-images-idx3-ubyte.gz
Extracting ./datasets/MNIST_data/train-labels-idx1-ubyte.gz
Extracting ./datasets/MNIST_data/t10k-images-idx3-ubyte.gz
Extracting ./datasets/MNIST_data/t10k-labels-idx1-ubyte.gz
Training data size: 55000
Validating data size: 5000
Testing data size: 10000
从上面可见,通过input_data.read_data_sets方法导入的数据集将自动划分为train、validation、test三个数据集。
如果在官网下载缓慢,可以在我的博客主页的资源处下载。如果使用上面的代码导入,则可以把下载的压缩包解压到你所工作的project工程所处的文件夹内即可。