digit 手写数据库笔记 (机械学习)

参考书籍

第三章内容

在这里插入图片描述

digit 手写数据库

# 最初的分类器
# digits 手写数字库

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import tree
# 性能评价相关的库
from sklearn import metrics

# digits 数据加载
digits = datasets.load_digits()

# 显示此库中第一行的数据
data = digits.data
print(data[0])

# 将画像以2行5列表示
# 前10个手写数字表示
for label, img in zip(digits.target[:10], digits.images[:10]):
    plt.subplot(2,5, label+1)
    plt.axis('off')
    plt.imshow(img, cmap=plt.cm.gray_r, interpolation='nearest')
    plt.title('Digit: {0}'.format(label))

plt.show()

# 求 3 和 8 的位置
flag_3_8 = (digits.target == 3) + (digits.target == 8)

# 获取 3 和 8 的数据
images = digits.images[flag_3_8]
labels = digits.target[flag_3_8]

# 将 3 和 8 的画像数据一次元化
images = images.reshape(images.shape[0], -1)

# 生成分类器
n_samples = len(flag_3_8[flag_3_8])
train_size = int(n_samples * 3 / 5)
# 在tree.DecisionTreeClassifier中生成分类器
classifier = tree.DecisionTreeClassifier()
# 将学习数据给到classifier.fit
# 为了简单使用了60% 的数据作为训练数据
# train_size是作为训练和测试的分界点
classifier.fit(images[:train_size], labels[:train_size])



# 使用剩下的数据进行测试,也就是40%
# 因此这里的测试数据是从 train_size 开始的
# 提取测试数据的标签作为正确标签。
expected = labels[train_size:]
# 分类执行,取出测试数据的预测结果
predicted = classifier.predict(images[train_size:])

# 打印结果
# accuracy_score用来计算正确率
print('accuracy: \n', metrics.accuracy_score(expected, predicted))

结果

在这里插入图片描述
[ 0. 0. 5. 13. 9. 1. 0. 0. 0. 0. 13. 15. 10. 15. 5. 0. 0. 3.
15. 2. 0. 11. 8. 0. 0. 4. 12. 0. 0. 8. 8. 0. 0. 5. 8. 0.
0. 9. 8. 0. 0. 4. 11. 0. 1. 12. 7. 0. 0. 2. 14. 5. 10. 12.
0. 0. 0. 0. 6. 13. 10. 0. 0. 0.]
accuracy:
0.8531468531468531

  • 19
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值