身份证识别Proj_第一周总结
项目目标:
给定一张身份证正、反面,识别身份证上的所有文字信息。
(包括汉族身份证和少数民族身份证)
流程
- 图片预处理
- 证件区域识别
- 字符切分
- 字符识别
1、图片预处理
- 输入图像
- 转换为灰度图(选取R分量作为彩色图像的灰度化)
- 二值化处理(获取图像的全局阈值和局部阈值)
- 图像规范化、膨胀
- 边缘检测(证件细定位)
- 轮廓提取
- 自适应二值化提取
2、证件区域识别
- 倾斜矫正(霍夫变换)
3、字符切分
- 文字区域检测
- 特征提取(中、英、少数名族语言)
- 字符分割算法
4、字符识别
可用方法汇总
- 有模板匹配字符识别算法(OCR)
- 神经网络字符识别算法
- SVM+特征提取
- 深度学习之CNN(深度学习模型)
相关技术
python(OpenCV)-- 图像处理
深度学习或机器学习算法–识别字符
相关资料
- 论文期刊
- 源码参考
其他难点事项
1. 拍摄识别图像时增加一个人像区域提示框原因?
经实践发现,只要身份证号码处于摄像头预览图层中时,即不用完全对准身份证也可以读取到身份证号码,但此时截取到的身份证图像并不完整。
为获取到比较完整的身份证图像,经多次实践发现,当身份证人像大约位于拍摄框中的右上区域时,此时可获取到比较完整的身份证图像。
因此,在拍摄框中右上区域加了一个人像区域提示框,并将该区域设为扫描人脸的区域,只有该区域扫描到身份证上的人脸时(确保用户的确将身份证人像对准了拍摄框中的人像框),才执行读取身份证信息的操作。
项目流程
项目甘特图