Android实现扫一扫识别图像数字(镂空图像数字训练)(上)
关于
应项目需求,要开发Android实现扫一扫将数字识别出来。但是网上得一些涉及到数字的识别率不高。所以需要自己针对要扫描得数字类型进行特别训练。查了一些资料,Android想扫描识别数字需要采用OCR (Optical Character Recognition,光学字符识别)来实现。tess-two使我们可以在Android上使用OCR。本篇主要讲解得是学习训练识别镂空数字的过程。
需要的工具以及安装运行步骤如下
1.安装tesseract
tesseract不是python的库文件,因此需要从网上下载安装,安装文件下载请点这里,进入网页后,根据需要选择高亮的蓝色字体进行下载,下载后按默认安装即可。
tesseract实际上是在windows命令行模式下使用的工具,因此需要配置其环境变量。配置方法如下:打开我的电脑属性——更改设置——高级——环境变量,在系统变量中添加tesseract的路径。如下:
新增名为TESSDATA_PREFIX 变量值为D:\Program Files (x86)\Tesseract-OCR\tessdata (这里放你的安装地址里面得tessdata)如下:
打开cmd输入 tesseract -v 如果显示版本信息则表示成功。失败的话可能是你得电脑没有java环境。
2.下载使用jTessBoxEditor与素材准备
下载地址 网盘 提取码 tobe(不过不是最新的)。最新下载地址
下载完成后直接解压到你想放到的盘区里,打开解压文件夹,找到里面train.bat的如下图,单机运行即为我们要修改训练数据的软件(这里是windows系统):
打开的界面如下,其中箭头所指的方向则是我们需要用到的修改产生的box文件:
下面就是我们的自己训练找的网图如下(你可以找自己要训练的数字类型):