目录
如何将一张身份证图像的信息识别出来?
身份证识别点我
银行卡识别点我
目前,人社、金融、工商、公安等政府办事部门使用身份证OCR技术,可以快速识别用户身份信息,缓解政府部门办事压力,减少业务办理的等待时间,是智能识别产业在政务领域的一大突破。
百度、优图等互联网大厂纷纷建立智能识别开放平台。
那么我们不仅要问一张身份证图像信息是如何被精确的结构化识别和传递的呢?

本文将借助项目经验,以身份证信息识别为示例,着重将这一识别流程和框架总结介绍。
第一步 目标检测
毫无疑问我们第一步需要检测和定位我们感兴趣的区域,这是高精度识别的基础。
也就是说我们首先要找到身份证在图像上是否存在,如果存在那么它大概在什么图像坐标位置。

这一步可采用主流目标检测算法有YOLOv3,SSD,Faster RCNN等。
第二步 图像校正
实际应用场景中图像可能是多角度放置的。
需要通过透视变换将变形的目标校正到良好的俯瞰平面。向下面图示一样。。

如何获取匹配点对坐标
由透视变换原理,求解透视变换矩阵至少需要4点对映射。
也就是说我们需要获得至少包括身份证卡片的四个顶点,将其投影到一个标准的卡片尺寸大小。
我们可以根据行业标准获取卡片长宽比为1.6:1,可设置目标顶点坐标(0,0)(1024,0)(1024,640)(0,640)
那么问题来了,图像中身份证顶点坐标如何获取?
经验告诉我们身份证卡边都是直线,透视变换后基本也是直线,通过直线检测获取四条直线相交即可