3 Tesseract-ocr 系列：安装 jTessBoxEditor，结合tesseract-ocr-3.4 训练

最新推荐文章于 2024-06-24 14:36:02 发布

蜗牛山

最新推荐文章于 2024-06-24 14:36:02 发布

阅读量4.3k

点赞数

分类专栏：笔记 tesseract ubuntu 文章标签： ubuntu jTessBoxEd java

本文链接：https://blog.csdn.net/u011807371/article/details/77101570

版权

19 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

我的本地环境 Ubuntu16.04 + Tesseract-ocr-3.4

上篇博客中提到可以使用 jTessBoxEditor 这个工具生成带字体格式的字体图片文件 (~.tif 和 ~.box).这里主要将其安装和使用。因为 jTessBoxEditor 以来 java 虚拟机，所以在安装前要先安装 java。

一、安装 java

二、安装和使用 jTessBoxEditor

主要参考：
利用jTessBoxEditor工具进行Tesseract3.02.02样本训练，提高验证码识别率
http://www.cnblogs.com/zhongtang/p/5555950.html

下载 jTessBoxEditor，下载地址：
https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/jTessBoxEditor-1.5.zip/download?use_mirror=nchc
解压
tar -zxvf jTessBoxEditor-1.7.3
跳转到解压后的目录：
cd /~/jTessBoxEditor-1.7.3
启动 jTessBoxEditor，命令行输入
java -Xms128m -Xmx1024m -jar jTessBoxEditor.jar
打开后界面如图：
具体使用方法见博客：
利用jTessBoxEditor工具进行Tesseract3.02.02样本训练，提高验证码识别率
http://www.cnblogs.com/zhongtang/p/5555950.html

关注