数字图像字符识别——数字识别

最新推荐文章于 2025-10-05 16:24:11 发布

原创最新推荐文章于 2025-10-05 16:24:11 发布 · 5.8w 阅读

·

43

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#数字图像字符识别 #openCV

opencv问题专栏收录该内容

3 篇文章

订阅专栏

本文介绍了一种基于模板匹配的图片字符识别方法，包括图片预处理、图像分割及字符识别等步骤，通过使用OpenCV实现对图像中数字的有效识别。

本文简单介绍图片字符识别的原理，主要识别图片中的数字，其他字符识别原理类似。

大家应该知道，对于人类来说，可以很容易理解一张图片所表达的信息，这是人类视觉系统数万年演变进化的结果。但对于计算机这个诞生进化不到百年的 “新星”，要让它理解一张图像上的信息是一个复杂的过程。计算机理解图像是一个数字计算比较的过程。

如图，我们一目了然的识别的图像中的数字，如何让计算机识别下图中的数字呢？

环境：VS2015+openCV3.4.0

要识别图像字符，首先需要模版库。对于识别简单字符，可自己训练，也可网上下载数据集。笔者这里就直接用提前做好的（用photoshop制作，字体和字大小尽量和待识别字符相近，不然影响识别率），为便于识别，模版名就以数字命名。

1. 图片预处理。首先读取待识别图像，灰度化、二值化。

Mat srcImg = imread("H:\\test.jpg",CV_LOAD_IMAGE_GRAYSCALE);//打开图片

灰度后图像：

threshold(srcImg, srcImg, threshVal, 255, CV_THRESH_BINARY);//二值化

我们知道图像本身就以数字进行存储的，二值化后图像就只有两个值0和255.

例数字0：

注意二值化的阈值根据图像实际情况进行调整。

二值化图像后：

2. 图像分割。我们需要将图像中的字符分割开。整个过程分两部，左右分割和上下分割。基本思想是，从图像的左上角第一列开始，从左往右逐列扫描扫描，当遇到像素值为0时，记录该列号sCol，继续扫描再遇到整列像素值为255时，记录列号eCol，sCol与eCol之间即为字符所在区间。复制二值图该区域，这样完成了左右分割；

将左右分割后，在此基础上再对图像进行上下分割，同理，从图像左上角第一行，向下逐行扫描，当遇到像素值为255时，记录该列号sRow，继续扫描再遇到整列像素值为0时，记录列号eRow，sRow与eRow之间即为字符所在区间。复制该区域，这样完成了上下左右分割。

3. 识别。把切割后的数字图片大小调整到和模板一样的大小（一般以模版中最大尺寸），然后让需要匹配的图和别和10个模板相减（让两个图片对应坐标像素点值相减），将所有差的绝对值求和。

最后与哪个模板匹配时绝对值和最小，则就可以得到图像与该模版最匹配，进而识别该字符。

4. 结果。

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。