如何正确的加载MNIST数据集
MNIST数据集是一组由美国高中生和人口调查局员工手写的70000个数字的图片,每个图片有784个特征,即28*28的像素点。每张图像都用其代表的数字标记。此数据集堪称机器学习领域的“hello world”。
那么我们如何使用该数据集呢?
1、首先需要导入如下包
from sklearn.datasets import fetch_mldata
2、随后在网上下载mnist-original.mat文件,将其放入当前工作目录下的\datasets\mldata中,注意要提前创建文件夹,将该文件放进去。
3、然后写入以下代码
mnist = fetch_mldata('MNIST original',data_home='./datasets')
print(mnist.data.shape)
(70000, 784)
这样MNIST数据集就成功的加载进来啦!!!