Python,OpenCV使用KNN来构建手写数字及字母识别OCR
这篇博客将介绍如何借助OpenCV提供的手写数字及字母数据集,来构建训练KNN模型,以进行手写数字及字母的识别。
并分别达到手写数字 91% 的精确度,字母93%的精确度。
提升模型精确度的方法有1)增加训练数据集以及 2)增加错误的数据集;
OCR 即 Optical Character Recognition 光学字符识别,表示在图像上进行文本等的识别;
1. 原理
1.1 手写数字识别
OpenCV提供了手写数字数据集:digits.png 共包括5000个手写数字(0~10),每个数字500个。
- 加载数据集 digits.png(得到5000个数据集,10个标签(0~9)
- 拆分为训练数据集、测试数据集(各2500个,10个标签)
- 用训练数据集+标