利用opencv库识别身份证图片

一、前言

本文主要实现了对身份证图片上身份证号码的自动识别,在Qt平台上使用opencv进行图像处理,并绘制简单的用户界面,设计了一个基于Qt和opencv的身份证号码识别系统。

二、用户界面

       用户界面如下所示,简单几个控件,这里只是实现了身份证号码的识别,而没有对汉字(姓名及地址)识别,水平尚且不足。


三、身份证图像处理流程

下图为身份证识别系统的系统框图。


四、图像二值化处理

再打开一副图片,也即获取一副彩色身份证图片后,为使得身份证号码颜色与背景色呈现较大差别,故选取R分量作为彩色图像的灰度化,接着对图像进行二值化处理。这里需要获取图像的全局阈值和局部阈值。

首先由Otsu算法(opencv已实现)获得整幅图像的全局阈值T,再由Beresen方法计算得当前像素的领域窗口内的灰度均值Tbn,再利用整个图像的最大灰度值和最小灰度值计算得到一个矫正因素b,则二值化公式可由下式子确定

                  

其中T为Ostu全局阈值,Tbn由下式确定: 

                

b由下式确定: 

                                   

其中g2为图像中灰度的最大值,g1为图像中灰度的最小值,C为经验系数,通常取0.12算法在函数OstuBeresenThreshold实现,实现的效果如下所示:


五、身份证号码定位

       将二值化得到的图像进行黑白反色处理,即背景为黑色,身份证号码为白色,接着对图像进行闭操作后,使用findContours检测二值图像中的白色像素块的外轮廓,将符合长宽比及面积要求的轮廓提取出来。要找到的轮廓如下所示:


要做汉字识别的话,可以在这部分将汉字区域定位并剪切出来

六、号码分割

观察到所获得的裁剪出来的身份证号码图像(已经缩放至300*20分辨率大小)如下所示:

                                   

在该图像中,显然身份证号码与背景图像颜色区分度高,故进反色后,使用Otsu方法二值化后可得

                                  

要将号码分割出来,则只需进行列分割,也即统计

                                 

其中f(x,y)为介于两个字符之间的像素,该过程由函数char_segment实现

七、特征提取

提取数字字符的特征向量,也即提取梯度分布特征+灰度分布特征+水平投影直方图+垂直投影直方图,最后每个字符得到一个1*72的特征向量,由calcGradientFeat函数实现

八、神经网络训练

所使用的训练图片均由从多张身份证图片上分割得到,之后经过特征提取,获得训练矩阵和标签矩阵保存于ann_xml.xml文件中,由函数getAnnXML实现,然后由ann_train从中读取训练矩阵和标签矩阵用于神经网络训练,opencv中实现的是多层感知器神经网络。

九、分类器分类

使用训练得的神经网络对所提取的字符特征向量进行分类,由函数classify实现。

十、校验位计算

由于最后一位有时识别率不高,可能是最后一位的分割结果不是很好,故最后1位校验位直接由前17位数字计算得,由getParityBit函数实现。

十一、结果显示

该身份证号码识别系统所处理的图像必须要求身份证区域尽可能占整幅图像更多的区域,且在纯色背景下拍摄,另外需保证拍摄得的身份证图像尽可能光照均匀,不能有高光存在。如下所示


系统识别结果示意如下:


所使用身份证图片均来自百度搜索

源程序下载:http://download.csdn.net/detail/ap1005834/9530222

  • 4
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值