导入数据是tensorflow(以下简称TF)及机器学习中重要的一步,现学习TF中导入数据的方法。
MNIST数据库是机器学习训练中最常见的一个数据库,包涵一个6万张数字图片的训练集和1万张数字图片的测试集。训练集中一般另外抽出5000张用于validation(验证)防止过拟合。下面是实践导入MNIST数据的简单语法:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot = True) #在本地建立数据文件夹MNIST_data
print(len(mnist.train.images))
结果应该是55000。但是现在出现了错误:
File "D:/fs/coding/mnist.py", line 2, in <module>
mnist = input_data.read_data_sets("MNIST_data/", one_hot = True)
File "D:\fs\Anaconda3\envs\tensorflow\lib\site-packages\tensorflow\python\util\deprecation.py", line 250, in new_func
return func(*args, **kwargs)
File "D:\fs\Anaconda3\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py", line 260, in read_data_sets
source_u