手写数字识别是一个经典的机器学习问题,通过识别手写体图片来判断数字
因为数字类别是0——9,所以是十分类问题
本文以KNN算法为例,来实现手写数字的识别
低维的手写数字识别
sklearn中有自带的手写数字数据集,用datasets.load_digits()来调用
关于load_digits简介
load_digits返回的 digits 数据集有1797个数据,数据的维度为64
digits是一个Bunch类型的类字典对象,我们可以利用索引来调用它
调用
from sklearn import datasets
digits = datasets.load_digits()
索引
digits有5个部分:
data:数据,其中每个元素是64维的向量
images:图像,其中每个元素是8×8的矩阵
target:每个数据对应的标签
target_names:所有的类别标签
以第0个元素为例:
64维的向量
8×8的矩阵,可以大致看出数字 ‘0’ 的轮廓
用plt.ims