使用jTessBoxEditorFX-2.2.0制作自己的字库

在使用tesseract-ocr进行字符识别时,我们使用了官方提供的字库,例如英文字库、中文字库,但这些字库并不一定能满足我们所有的需求。当tesseract提供的字库中没有我们识别的那种字体时,就会出现识别错误的问题,这个时候就需要训练自己的字库进行训练了。我们可以制作出识别车牌的车牌字库、识别身份证号的身份证字库。
在这里插入图片描述

1 下载并安装jTessBoxEditorFX

注意jTessBoxEditor有两个版本,带FX的版本才支持中文字符编辑,我们下载带FX版本的。在这个网址上列出了所有的jTessBoxEditorFX版本。
https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/
在这里插入图片描述
jTessBoxEditorFX-2.2.0.zip
下载完成后解压
如下图:

在这里插入图片描述
我们注意到解压目录下也有一个tesseract-ocr,因此我们需要配置tesseract-ocr的环境变量。
在系统环境变量path路径下添加E:\jTessBoxEditorFX\tesseract-ocr
在这里插入图片描述
新建字库tessdata的系统变量,变量名为:TESSDATA_PREFIX
变量值为:E:\jTessBoxEditorFX\tesseract-ocr\tessdata
确定后将电脑重启,至此jTessBoxEditorFX安装配置完成。

2 准备字库训练图片,并制作tif图片文件

字库的训练图片格式最好是png的,注意图片数字周围的空白区域不能太窄,tesseract无法识别空白区域太窄的字符。
数字图片下载地址
如下图所示:
在这里插入图片描述
我们将上面的图片放到一个E:\jTessBoxEditorFX目录下新建的train_image文件夹下。
在E:\jTessBoxEditorFX目录下有一个jTessBoxEditorFX.jar的java文件,这个文件需要用java虚拟机打开,其实就是你电脑上安装了java,并配置了java环境就可以直接双击打开,安装java这里不再讲述了。
在这里插入图片描述
打开这个jar文件,如下:
在这里插入图片描述
选择 Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片,注意对话框中“文件类型”的选取,选择所有的图片文件
在这里插入图片描述
选择好了后,点击打开按钮,出现文件保存对话框,输入文件名:num_1.font.exp0.tif
在这里插入图片描述
正确进行上述步骤后会出现merge完成的提示
在这里插入图片描述
然后在图片集那个文件目录下会出现生成的这个tif文件
在这里插入图片描述

3 使用tesseract生成.box文件

打开命令提示符,进入步骤2生成的num_1.font.exp0.tif文件所在目录
在这里插入图片描述
然后执行如下命令:

tesseract num_1.font.exp0.tif num_1.font.exp0 –l eng batch.nochop makebox

在这里插入图片描述
执行完成后,会在当前目录下生成num_1.font.exp0.box文件。
在这里插入图片描述
使用jTessBoxEditor调整.box训练文件
.box文件中记录了每个字符在图片上的位置以及识别出的内容,训练之前需要使用jTessBoxEditor调整字符的位置和内容。
打开 jTessBoxEditor ,点击 Box Editor -> Open ,打开步骤2中生成的 “num_1font.exp0.tif” ,会自动关联到 “num_1.font.exp0.box” 文件:
在这里插入图片描述
打开完成后,每一个会显示每一张图片的的识别结果
在这里插入图片描述
接下来我们对每张图片的识别字符和识别框进行纠正,如果字符识别错了,我们就改成正确的,如果识别出现偏差,我们也要进行调整。
这个过程是非常重要的,字符框的好坏取决于方框是否调整的准确。
我们把所有图片的全部纠正完。
在这里插入图片描述
点击save按钮,将校正后的box文件保存。
在这里插入图片描述

4 使用echo命令创建字体特征文件

在命令符窗口中输入如下命令:

echo num_1 0 0 0 0 0>font_properties

在这里插入图片描述
执行完成之后,在当前文件夹下生成font_properties文件
也可以手动在该文件夹下建立一个名为 “font_properties” 的文件,这个文件没有后缀名称,输入内容 “font 0 0 0 0 0” , 表示字体 font 的粗体、倾斜等共计5个属性全都设置为0
在这里插入图片描述

5 使用tesseract生成num_1.font.exp0.tr训练文件

在命令行窗口中输入命令:

tesseract num_1.font.exp0.tif num_1.font.exp0 nobatch box.train

在这里插入图片描述
生成训练文件成功

在这里插入图片描述
在这里插入图片描述

6 生成字符集文件

在命令行中执行如下命令:

unicharset_extractor num_1.font.exp0.box

在这里插入图片描述
执行之后在当前目录生成unicharset文件
在这里插入图片描述

7 生成数据字典

在命令行中先执行如下命令:

mftraining -F font_properties -U unicharset -O num_1.unicharset num_1.font.exp0.tr

在这里插入图片描述
接着执行另外一个训练命令:

cntraining num_1.font.exp0.tr

在这里插入图片描述

会在当前目录下生成 4 个文件(inttemp、pffmtable、normproto、shapetable)
在这里插入图片描述
需要手动修改名称,这里我们修改成num_1.inttemp、num_1.pffmtable、num_1.normproto、num_1.shapetable。
在这里插入图片描述

8 合并数据文件,生成字库文件

在命令提示符中执行如下命令:

combine_tessdata num_1.

在这里插入图片描述
生成字库文件成功,会在当前目录生成num_1.traineddata文件,这个语言就是跟我们下载的官方字库一样,例如eng,chi_sim一样,不过这个字库专门用于识别图片中那种数字字体。
在这里插入图片描述
我们把这个字库num_1放到tesseract-ocr的tessdata目录下E:\jTessBoxEditorFX\tesseract-ocr\tessdata
在这里插入图片描述

9 验证生成的语言包字库

输入命令:

tesseract --list-langs

可以看到语言库中有自己刚添加的字库num_1

在这里插入图片描述
我们用这个字库来识别一张图片

tesseract 72.png out -l num_1

会在图片目录下生成out.txt文件,我们打开这个txt文件,可以看到使用num_1字库识别这张图片的结果

在这里插入图片描述
打开out文件
在这里插入图片描述
发现识别结果与图片完全符合,至此,自己制作的字库就已经成功了,可以识别所有这种数字字体的图片。

补充,如果在制作box文件时,这张图片没有识别出特征字体,就代表无法去进行box微调。
在这里插入图片描述
用notepad++打开box文件,如下所示:
在这里插入图片描述
3 15 40 40 100 32
第一个字符3是这张图片识别的char,15为X坐标,40为Y坐标,40为宽,100为高的,最后一个32就是第几张图片,因为图片编号从0开始,所以这个是第33张图片。

因此如果哪一张图片缺少识别宽,比如第200张图片少定位框,就这样加
3 15 40 40 100 199

nacos-server-2.2.0.zip是一个开源的注册中心和配置中心的集群版本。Nacos是阿里巴巴开源的一款服务发现和配置管理工具,它能够帮助我们实现动态服务发现、服务配置与服务元数据管理。nacos-server-2.2.0.zip是Nacos的2.2.0版本的发布包。 通过下载nacos-server-2.2.0.zip,我们可以得到Nacos服务端的安装包。安装nacos-server之后,我们可以运行Nacos的集群,实现高可用和负载均衡。Nacos支持集群模式下的多个节点,节点之间可以进行注册同步、配置同步和心跳检测等操作。 使用nacos-server-2.2.0.zip,我们可以搭建自己的Nacos服务端环境。首先,我们需要下载并解压该安装包。然后,配置Nacos的相关参数,如数据库连接、集群节点等。接着,我们可以启动Nacos服务。一旦Nacos服务启动成功,我们就可以通过Nacos的Web界面进行服务注册、配置管理等操作。 nacos-server-2.2.0.zip提供了一个便捷的方式来搭建自己的Nacos服务集群。通过使用Nacos,我们可以更加方便地管理我们的服务注册和配置,支持动态更新和变更。这对于云原生应用的开发和部署非常有帮助,能够提高开发效率和系统可靠性。 总之,nacos-server-2.2.0.zip是Nacos的2.2.0版本的发布包,可以用于搭建自己的Nacos服务端环境,实现服务注册、配置管理等功能。通过使用Nacos,我们可以更好地支持云原生应用的开发和部署。
评论 30
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Keras深度学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值