MNIST数据集 -成功导入方法2018
Sklearn 与 TensorFlow 机器学习实用指南,这本书对于学习机器学习,确实是一本不错的入门级的好书,对于分类的讲解章节中,用到MNIST数据集的导入。
如下是书中的原始代码,多次导入不能成功,提示 could not read bytes错误
>>> from sklearn.datasets import fetch_mldata >>> mnist = fetch_mldata('MNIST original') >>> mnist {'COL_NAMES': ['label', 'data'], 'DESCR': 'mldata.org dataset: mnist-original', 'data': array([[0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], ..., [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0]], dtype=uint8), 'target': array([ 0., 0., 0., ..., 9., 9., 9.])}1\在网上搜索解决办法如下,下载mnist_all.mat文件,并指定数据缓冲路径。均不能正常导入文件
2、 后观察原始代码中,数据集名称“MNIST original”,中间是个空格,而通常的文件名称不该有空格才对,怀疑有没有可能是文件名称,现在已有跟新?尝试使用mnist作为数据集名称,最终能正常导入数据。