先说主要问题:
案例中的原始方法,如下是行不通。不知道是网络上数据集改位置了还是怎么的
from sklearn.datasets import fetch_mldata
mnist = fetch_mldata('MNIST original')
具体解决方法:
首先在github上手动下载数据集文件
https://github.com/amplab/datascience-sp14/raw/master/lab7/mldata/mnist-original.mat
from sklearn.datasets import fetch_mldata
mnist = fetch_mldata('MNIST original',data_home='/home/jie/下载/')
该段代码中需要注意一下:
1、下载下来的数据集名称是mnist-original.mat,但是并不是说在fetch_mldata函数中就要通过这个名字获得数据集,而是依然必须保证是'MNIST original'的名字。
2、‘/home/jie/下载/’是数据集文件的下载地址,但是并不是填写上就万事大吉了,而是还需要在该目录下新建一个“mldata”的文件夹,将数据集文件放入该文件夹中,然后运行上段代码,获取数据集合成功。