使用K近邻算法实现手写体识别系统

最新推荐文章于 2024-08-11 22:50:26 发布

海涛anywn

最新推荐文章于 2024-08-11 22:50:26 发布

阅读量8.6k

点赞数 2

分类专栏：机器学习算法文章标签：机器学习算法

本文链接：https://blog.csdn.net/lihaitao000/article/details/51405336

版权

本文介绍了使用K近邻算法实现手写体识别系统的过程。通过Python 2.7和numpy库进行开发，数据来源于UCI资料库的手写数字数据集。系统经过数据预处理，将图像转换为向量，然后利用K近邻算法进行分类。实验展示了在不同k值下（3、6、2）的错误率，发现k=3时错误率最低，为1.2%。文章还探讨了算法的优化与错误率的关系。

摘要由CSDN通过智能技术生成

目录
1. 应用介绍
1.1实验环境介绍
1.2应用背景介绍
2. 数据来源及预处理
2.1数据来源及格式
2.2数据预处理
3. 算法设计与实现
3.1手写体识别系统算法实现过程
3.2 K近邻算法实现
3.3手写体识别系统实现
3.4算法改进与优化

4. 系统运行过程与结果展示

1.应用介绍
1.1实验环境介绍
本次实验主要使用Python语言开发完成，Python的版本为2.7，并且使用numpy函数库做一些数值计算和处理。
1.2应用背景介绍
本次实验实现的是简易的手写体识别系统，即根据用户输入的手写体照片可以识别出手写体数字是多少。本次输入的手写体是用0,1数字拼成的手写体数字。本次完成手写体的识别使用K近邻算法，k近邻算法设计简单，容易实现，且对特定的问题分类的效果也比较好。因此本次实验选择k近邻来对手写体进行分类和识别，也是对手写体图片特征数据的挖掘过程。

2.数据来源及预处理
2.1数据来源及格式
该数据集合修改自“手写数字数据集的光学识别” 一文中的数据集合，该文登载于2010年10月3日的UCI资料库中http://archive.ics.uci.edu/ml。
为了简单起见，这里构造的系统只能识别数字0到9。需要识别的数字已经使用图形处理软件，处理成具有相同的色彩和大小: 宽髙是32像素*32像素的黑白图像。尽管采用文本格式存储图像不能有效地利用内存空间，但是为了方便理解，我们还是将图像转换为文本格式。