数据集加载,本来想使用sklearn中的 fetch_openml函数直接从网站下载数据集,然而现在这条命令不行(似乎是网站问题),因此,尝试用使用本地加载首先在
链接:https://pan.baidu.com/s/163MTS_89EKpJZsO6da5J3w
提取码:it3v
复制这段内容后打开百度网盘手机App,操作更方便哦
下载MNIST文件,里面一共有7w个手写数字样本数据,每个数据有28*28=784维。
import numpy as np
from sklearn.datasets import fetch_openml#使用此命令失败
文件目录结构
下载下来的数据:mnist-original.mat
使用scipy.io 读取.mat文件
import scipy.io as sio
mnist = sio.loadmat('datasets/mnist-original.mat')
print(mnist)
{
'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Sun Mar 30 03:19:02 2014', '__version__': '1.0', '__globals__': [], 'mldata_descr_ordering': array([[array(['label'], dtype='<U5'), array(['data'], dtype='<U4')]],
dtype=object)