利用SVM(支持向量机)和MNIST库在OpenCV环境下实现手写数字0~9的识别

昊虹AI笔记

已于 2022-03-02 09:28:34 修改

阅读量1w

点赞数 2

分类专栏：图像处理原理、工具、代码文章标签： SVM MNIST 手定数字识别

于 2016-08-09 11:11:59 首次发布

本文链接：https://blog.csdn.net/wenhao_ir/article/details/52160225

版权

图像处理原理、工具、代码专栏收录该内容

288 篇文章 123 订阅

订阅专栏

图像处理开发需求、图像处理接私活挣零花钱，请加微信/QQ 2487872782
图像处理开发资料、图像处理技术交流请加QQ群，群号 271891601

SVM是一种有机监督的机器学习方式，什么叫有监督？就是机器在学习时，有先验知识~SVM的理论细节很复杂，因为现在还不需要，所以博主也没有去深入研究，以后需要的时候再去学习吧。简单地说，SVM就是把一幅图进行各种运算，提取出一幅图像的特征，特征用向量表示，通过不断的学习，让这个向量越来越逼近图像的真实特征，具体的手段是把图像数据不断地进行抽像提取特征。

OpenCV3.0.0中提供了类SVM用于实现SVM支持向量机算法，实际上这个类调用的是台湾林智仁等开发设计的LIBSVM来实现SVM训练的，详细的使用方法可参见网页http://blog.sina.com.cn/s/blog_4c70701801013xui.html

既然是调用别人写好的算法，那程序就简单了，首先，是要给SVM喂食（提供训练库），MNIST库是美国人提供的一个免费的手定数字识别库，我前边已经写了博文给了下载地址：手写数字图片库MNIST百度网盘下载链接~ 这个库由四部分组成，下面分别介绍：

train-images-idx3-ubyte：训练图像源

train-labels-idx1-ubyte：训练图像的标签-就是"train-images-idx3-ubyte"中每幅图像中写的是什么数字

t10k-images-idx3-ubyte：测试图像

t10k-labels-idx1-ubyte：测试图像的标签-就是"t10k-images-idx3-ubyte"中每幅图像中写的是什么数字

下面是使用上面的训练图像和测试图像进行SVM训练并进行性能测试的代码：

PS: 代码比较简单，注释也写得很清楚，这里就不作解释了！‘

代码中用到的训练库我上面已经提供了下载链接！

抱歉，各位，在博主换了电脑后，由于忘了之前下的是哪个3.0版本，所以随便下载了3.0的Beta版，但配置好之后事却发现类SVM下的成员函数setType、setKernel、setKernel、setGamma、setC、setTermCriteria不存在，所以编译通不过，这让博主百思不得其解，至今这个问题未解，所以代码不能给大家了。而且管理员也搜索了其它3.0的帮助文档，均没有发现这几个成员函数。

从运行结果中我们可以看出，六万张训练生成SVM的XML文件用了564秒，随后用训练的结果进行训练数据的测试，一万张测试图片正确的识别个数为9833，错误率为1.67%。

接下来，我们修改程序，使其识别测试库t10k-images-idx3-ubyte的单张图像，手写数字图片库MNIST百度网盘下载链接~有一个压缩包，里边已经把测试图像全面输出为一张一张的bmp图像，我们用其中一张图像进行测试，以便进一步测试我们自己手写的图像。这段代码的关键是要将单幅图像的格式转化为类SVM中predict能处理的数据格式。代码如下：

代码中用到的XML文件和两幅图像下载链接：识别单幅手写数字_免费高速下载|百度网盘-分享无限制

运行结果如下所示：

可见，能正确识别单幅测试图像！

接下来，再修改程序，使其能识别自己手写的单个数字（既然是单个，则无分割问题）：

程序中用到的手写数字图像下载链接：21.jpg_免费高速下载|百度网盘-分享无限制

特别说明一下：程序中，提取数字所在区域的立式外接矩形我通过手工确定在boundRect[的第9个，实际上每幅图像是不一样的，甚至更一般的情况下需要写专门的程序作处理，在实际应用时，必须要修改这一部分程序，否则根本没有通用性，提供一下我现在想到的思路吧：把boundRect[中最左上的坐标和最右下的坐标找出来，这两个点构成的矩形就是数字的外接矩形了！

运行结果如下图所示：