sklearn 中本身自带了一些数据集,这里我们以手写数字为例进行学习:
1、了解下手写字体数据集的数据结构
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets,svm,metrics
digits = datasets.load_digits()
#digits: bunch类型
print(type(digits))
#digits 包含的数据结构,字典类型数据key,value
print('digits.keys() = ',digits.keys())
如图所示:digits 是手写数字的数据集,它的类型是bunch,即继承与字典的一种链式松散饿存储结构。
其中digits所包含的数据分为data、target、target_names、images、DESCR
2、Images 介绍
#imgaes 是一个三维矩阵1797 张 8 * 8的图片
print('digits.images.shape = ',digits.images.shape)
print('digits.images = ',digits.images)
plt.gray()
plt.matshow(digits.images[0]