项目简介:
使用sklearn来训练一个K最近邻(k-Nearest Neighbor, KNN)分类器,用于识别数据集DBRHD的手写数字。
学习内容:
DBRHD数据集:每一个图片是由0或1组成的32*32的文本矩阵
sklearn库:sklearn库共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。提供一批统一化的机器学习方法功能接口。
因此KNN的输入为图片矩阵展开的一个1024维的向量。
KNN是一种懒惰学习法,没有学习过程,只在预测时去查找最近邻的点,数据集的输入就是构建KNN分类器的过程。
注:文末附有本文数据集文件,分享给大家一起学习</