参考:
利用SVM(支持向量机)和MNIST库在OpenCV环境下实现手写数字0~9的识别 opencv3
随机决策森林——OpenCV类CvRTrees使用实例(数字识别)opencv2
基于qt和opencv3实现机器学习之:对OCR进行分类 oprncv3源代码
基于qt和opencv3实现机器学习之:利用最近邻算法(knn)实现手写数字分类
Opencv手写数字识别(Opencv3.0+KNN+HOG特征)
数据集:关键部分
OCR (Optical Character Recognition,光学字符识别),我们这个练习就是对OCR英文字母进行识别。得到一张OCR图片后,提取出字符相关的ROI图像,并且大小归一化,整个图像的像素值序列可以直接作为特征。但直接将整个图像作为特征数据维度太高,计算量太大,所以也可以进行一些降维处理,减少输入的数据量。
处理过程一般这样:先对原图像进行裁剪,得到字符的ROI图像,二值化。然后将图像分块,统计每个小块中非0像素的个数,这样就形成了一个较小的矩阵,这矩阵就是新的特征了。