Android实现扫一扫识别图像数字（镂空图像数字Tesseract训练）（上）

本文链接：https://blog.csdn.net/Tobey_r1/article/details/108784840

Android实现扫一扫识别图像数字（镂空图像数字训练）（上）

关于
- 需要的工具以及安装运行步骤如下

关于

应项目需求，要开发Android实现扫一扫将数字识别出来。但是网上得一些涉及到数字的识别率不高。所以需要自己针对要扫描得数字类型进行特别训练。查了一些资料，Android想扫描识别数字需要采用OCR （Optical Character Recognition，光学字符识别）来实现。tess-two使我们可以在Android上使用OCR。本篇主要讲解得是学习训练识别镂空数字的过程。

需要的工具以及安装运行步骤如下

1.安装tesseract

tesseract不是python的库文件，因此需要从网上下载安装，安装文件下载请点这里，进入网页后，根据需要选择高亮的蓝色字体进行下载，下载后按默认安装即可。

tesseract实际上是在windows命令行模式下使用的工具，因此需要配置其环境变量。配置方法如下：打开我的电脑属性——更改设置——高级——环境变量，在系统变量中添加tesseract的路径。如下：
在这里插入图片描述
新增名为TESSDATA_PREFIX 变量值为D:\Program Files (x86)\Tesseract-OCR\tessdata （这里放你的安装地址里面得tessdata）如下：

打开cmd输入 tesseract -v 如果显示版本信息则表示成功。失败的话可能是你得电脑没有java环境。

2.下载使用jTessBoxEditor与素材准备

下载地址网盘提取码 tobe（不过不是最新的）。最新下载地址
下载完成后直接解压到你想放到的盘区里，打开解压文件夹，找到里面train.bat的如下图，单机运行即为我们要修改训练数据的软件（这里是windows系统）：
在这里插入图片描述
打开的界面如下，其中箭头所指的方向则是我们需要用到的修改产生的box文件：

下面就是我们的自己训练找的网图如下（你可以找自己要训练的数字类型）：