安卓身份证识别

最新推荐文章于 2024-08-03 18:25:36 发布

SSSxCCC

最新推荐文章于 2024-08-03 18:25:36 发布

阅读量1.5k

点赞数 2

分类专栏：安卓app开发文章标签：安卓 android ocr

本文链接：https://blog.csdn.net/SSSxCCC/article/details/119000743

版权

安卓app开发专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文介绍了如何在安卓app中实现身份证内容的OCR识别。通过使用开源项目tess-two，结合训练好的模型文件，实现对身份证图片的文字转换。首先下载模型文件并存入sd卡，然后初始化TessBaseAPI，设置识别语言，处理图片并获取识别文本。为了提高效率，文章建议将身份证图片切割后并行识别各个区域。提供了源代码链接供参考。

摘要由CSDN通过智能技术生成

OCR介绍

要实现一个可以识别身份证内容的app，就需要用到OCR（optical character recognition）技术，OCR详细介绍可以看百度百科：OCR文字识别_百度百科 (baidu.com)。简单来说，OCR可以将图片转换成文字。github上开源的Tesseract即实现了OCR算法，然而Tesseract是用C++写的，在安卓app中使用会很麻烦。这里介绍github上另一个开源项目tess-two，使安卓app可以轻松调用tesseract算法。（虽然tess-two项目原作者目前不维护了，但是这个库目前还是能正常使用的）

tess-two介绍

tess-two提供了一套api可以方便安卓app调用。

首先我们需要下载训练好的模型文件保存到sd卡中，例如识别中文的训练好的模型文件下载地址：tessdata/chi_sim.traineddata at master · tesseract-ocr/tessdata (github.com)

在安卓sd卡中选择一个app有读写权限的目录tessdataPath，在这个目录中创建名为“tessdata”的文件夹，然后将下载的chi_sim.traineddata文件放到tessdata文件夹中。

准备好了tessdataPath目录后，tess-two的使用方法如下：

TessBaseAPI baseApi = new TessBaseAPI();  // new一个TessBaseAPI对象
baseApi.init(tessdataPath, "chi_sim");  // 调用init方法，传入tessdataPath，其中"chi_sim"表示加载的是识别中文的模型
baseApi.setImage(bitmap);  // 调用setImage方法传入要识别的bitmap图像
String text = baseApi.getUTF8Text();  // 调用getUTF8Text执行ocr算法得到文本
baseApi.clear();
baseApi.end();

安卓app实现

要预先准备训练好的模型文件是一件比较麻烦的事情，我采取的解决方案是将模型文件放入assets目录，在app启动时再将模型文件写入sd卡中。这样就直接用app即可，不用用户预先准备模型文件。

直接对整个身份证图片识别速度慢，准确率低，不方便提取单项数据。所以我采取的思路是对身份证图片进行切割，将姓名、性别、民族等单项信息单独切割出来再并行进行识别。

app的流程：首先调用相机对身份证进行拍照，然后将得到的照片进行裁剪，将姓名、性别等每个区域裁剪成一个bitmap，最后调用tess-two的api对身份证的每个区域的bitmap分别进行ocr识别转换成文字，其中每个bitmap都可以在独立的线程里面并行识别加快整体的识别速度。

源代码地址：SSSxCCC/IdCardRecognition: Android id card recognition based on OCR. 安卓基于OCR的身份证识别。 (github.com)

SSSxCCC

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
安卓身份证识别

OCR介绍要实现一个可以识别身份证内容的app，就需要用到OCR（optical character recognition）技术，OCR详细介绍可以看百度百科：OCR文字识别_百度百科 (baidu.com)。简单来说，OCR可以将图片转换成文字。github上开源的Tesseract即实现了OCR算法，然而Tesseract是用C++写的，在安卓app中使用会很麻烦。这里介绍github上另一个开源项目tess-two，使安卓app可以轻松调用tesseract算法。（虽然tess-two项目原作者
复制链接

扫一扫