前言
手写数字识别作为机器学习中一个比较有趣的内容,结合 K210 芯片强大的 KPU 算力,可以蹦出很多好玩的点子。本次以通俗易懂的方式记录一波玩耍手写数字识别的案例。
目录
- 相关理论
- 基于 KNN 分类算法的模型搭建(代码展示)
- 图片导入与分类预测(代码展示)
1、相关理论
1.1 图像二值化
如上图:是一个红色的数字4,像素尺寸为 32*32,即一共有1024个像素点,每个像素点的色彩值范围是0-255,其中0代表黑色,255代表白色,故本文以128为阈值进行划分。
令单个像素点的色彩值为 x ,则:x<=128 时,取 x = 1,反之 x = 0
经过上述变换,整张图片的色彩值就只有 0,1 两种了,此过程就是图片的二值化过程。
1.2 二值化数据的存储
经过二值化的图片,仍然有1024个像素点,只是其值仅有0,1两种,那么,怎样将图片的信息和模型之间建立联系呢?
下图是一份包含多张手写图像信息的 EXCEL 表格。从第一行来看,其第一列代表图片中的数字,其它列为分别为10