如题,就是对身份证拍照,处理相应照片,识别出身份证号码
这里需要调用opencv库。opencv库包含了许多处理图像的函数,功能全面而且强大,兼容多种语言。如何配置可以自行搜索。
主要流程如下:
读取照片,转化为灰度图像;
设置阈值,将灰度图像转化为2值图像(即黑白图);
将图像规范化,这个具体的size可以根据情况进行设定;
图像膨胀,将规范化的2值图像进行,因为之前进行了规范化,因此这里膨胀的幅度可以设为定值;(膨胀就是将黑点扩大范围,因此有字迹的地方将会连成一片,形成很多的contours)
调用函数FindContours()找出其中所有的contours,将返回一个列表,得到每个人contour的位置;
由于身份证号码所在位置固定,拍照方式合适,则可以根据contour的位置和其本身size,找到包含身份证号码的contour;
然后将这一片从之前的2值图像里分割出来,单独处理;
身份证号码有18位,需要将分割出来的这一块再次划分,分成18份,每份包含一个数字;
接下来就是分类方法了。
可以是KNN,也可以是SVM,在opencv里面都有调用接口。个人推荐KNN,方法比较直观,而且效果很不错。
关于KNN,它的训练和测试数据都是二维列表,首先需要将图片(往往是二维矩阵形式)转化为一维的列表表示,因此要求训练数据和测试数据的图片的size要统一。