一直在研究手写体识别,最终的目标是识别自己写的数字,目前能正确识别我自己写的字,识别率达到98.62%,可以识别自己的大小不一字体。学习例程如下:
1、学习opencv的自带手写体识别例程,发现无法识别自己的手写体
2、找到资料,有人说是中西方人写数字习惯不同(现在回顾应该不是唯一原因),思考做自己的手写体训练集
3、确定思路:A4纸打格子,打印,用红色圆珠笔写数字,自己写7页,女士写1页。扫描
4、思考如何去除格式,认为应颜色识别,边缘检测,排序,提取,字体大小标准化。
5、从GitHub上找到了一个opecv# 3的例程,一个一个例程研究代码,补充知识。
6、实现训练集文件处理的代码
7、根据自己的训练集文件进行knn测试,修改k的数值,保留识别率最大的k数值。
8、裁一些大小不一的数字,进行单个识别,完成了待识别的图片的标准化程序,完成最终工作。
原始的扫描训练集合文件如下:
生成训练集文件如下:(数字图片进行了排序,位置发生了变化)
此一步训练测试knn识别率达到98.62%
从测试文件中随机裁了几个图片识别,图片如下:
单独识别:完全正确识别。