sklearn中digits手写字体数据集介绍

1. 导入

from sklearn import datasets
digits = datasets.load_digits()

2. 属性查看

  • digits: bunch类型
print digits.keys()

['images', 'data', 'target_names', 'DESCR', 'target']

3. 具体数据

  • 1797个样本,每个样本包括8*8像素的图像和一个[0, 9]整数的标签

3.1 images

  • ndarray类型,保存8*8的图像,里面的元素是float64类型,共有1797张图片
  • 用于显示图片
# 获取第一张图片
print digits.images[0]
plt.imshow(digits.image[0])

[[  0.   0.   5.  13.   9.   1.   0.   0.]
 [  0.   0.  13.  15.  10.  15.   5.   0.]
 [  0.   3.  15.   2.   0.  11.   8.   0.]
 [  0.   4.  12.   0.   0.   8.   8.   0.]
 [  0.   5.   8.   0.   0.   9.   8.   0.]
 [  0.   4.  11.   0.   1.  12.   7.   0.]
 [  0.   2.  14.   5.  10.  12.   0.   0.]
 [  0.   0.   6.  13.  10.   0.   0.   0.]]

3.2 data

  • ndarray类型,将images按行展开成一行,共有1797行
  • 输入数据
# 获取第一张图片的数据
print digits.data[0]

[  0.   0.   5.  13.   9.   1.   0.   0.   0.   0.  13.  15.  10.  15.   5.
   0.   0.   3.  15.   2.   0.  11.   8.   0.   0.   4.  12.   0.   0.   8.
   8.   0.   0.   5.   8.   0.   0.   9.   8.   0.   0.   4.  11.   0.   1.
  12.   7.   0.   0.   2.  14.   5.  10.  12.   0.   0.   0.   0.   6.  13.
  10.   0.   0.   0.]

3.3 target

  • ndarray类型,指明每张图片的标签,也就是每张图片代表的数字
  • 输出数据,标签
# 获取第一张图片的标签
print digits.target[0]

0

3.4 target_names

  • ndarray类型,数据集中所有标签值
print digits.target_names

[0 1 2 3 4 5 6 7 8 9]

3.5 DESCR

  • 数据集的描述,作者,数据来源等
  • 20
    点赞
  • 77
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值