sklearn 自带手写字体数据集

最新推荐文章于 2024-09-04 09:08:11 发布

菜鸟小馒头

最新推荐文章于 2024-09-04 09:08:11 发布

阅读量1w

点赞数 5

分类专栏：机器学习

本文链接：https://blog.csdn.net/u011559236/article/details/78545506

版权

这篇博客介绍了sklearn库中的手写数字数据集，包括数据结构的解析，如digits数据集包含的data、target、target_names、images和DESCR等信息。重点讲解了images是1797张8*8的数字图片组成的三维矩阵，以及data是如何从images展开成一维数据的。

摘要由CSDN通过智能技术生成

sklearn 中本身自带了一些数据集，这里我们以手写数字为例进行学习：

1、了解下手写字体数据集的数据结构

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets,svm,metrics

digits = datasets.load_digits()

#digits: bunch类型
print(type(digits))

#digits 包含的数据结构，字典类型数据key，value
print('digits.keys() = ',digits.keys())

如图所示：digits 是手写数字的数据集，它的类型是bunch，即继承与字典的一种链式松散饿存储结构。

其中digits所包含的数据分为data、target、target_names、images、DESCR

2、Images 介绍

#imgaes 是一个三维矩阵1797 张 8 * 8的图片
print('digits.images.shape = ',digits.images.shape)
print('digits.images = ',digits.images)
plt.gray()
plt.matshow(digits.images[0]