文字识别(一) Tesseract识别与jTessBoxEditor环境搭建

最新推荐文章于 2022-05-10 21:38:08 发布

程序课代表

最新推荐文章于 2022-05-10 21:38:08 发布

阅读量1.2k

点赞数 2

分类专栏： android windows python 文章标签：文字识别 tesseract识别 jTessBoxEditor

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34508943/article/details/112972625

版权

android 同时被 3 个专栏收录

22 篇文章 4 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

一、Tesseract安装

下载方式一:

tesseract官方下载地址 https://digi.bib.uni-mannheim.de/tesseract/

其中带有dev的是开发版，不带的是稳定版，可以选择稳定版下载。

下载方式二:

第一种方式如果没有进行科学上网，可能下不下来，这时候可以使用第二种方式。

1.进入 https://github.com/tesseract-ocr/tesseract找到如下图所示，点击

2.进入到 https://tesseract-ocr.github.io/tessdoc/Home.html，里面mac,linux，windows等版本都有，因为我是windows系统，所以找到如下图所示，点击

3.进入到 https://github.com/UB-Mannheim/tesseract/wiki，找到系统对应的版本，下载安装

安装完成后，将安装路径(如：C:/java/Tesseract-OCR)配置到环境变量

配置完成，后打开cmd命令窗口，输入

tesseract -v

如看到以下输出，即代表Tesseract配置完成：

注:如果使用python环境测试，需要做一点改变:

在pytesseract安装后，在python的Lib目录下site-packges下会生成一个pytesseract文件夹，文件夹中找到pytesseract.py，路径在：C:/JAVA/Python36/Lib/site-packages/pytesseract，打开pytesseract.py，找到如下两行：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

将tesseract_cmd = 'tesseract'修改为：tesseract_cmd = 'C:/JAVA/Tesseract-OCR/tesseract.exe'

代表将tesseract_cmd配置为你安装tesseract-ocr的绝对路径，再去运行python代码，就没问题了。

二、jTessBoxEditor下载

以下介绍是官方网站下载方式，鉴于较慢，我在百度网盘准备了一份，点击下载提取码：nbc3

1.访问官方地址 http://vietocr.sourceforge.net/training.html，如下图所示，点击

2.进入到 https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/ 选择版本下载

zip结尾的，下载哪个版本都行。

注:jTessBoxEditor是依赖java环境的，如果没有安装jre无法运行

jre下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jre8-downloads-2133155.html

本章对jre安装和环境配置不做介绍，如不会安装请自行百度

本节结束，下节介绍使用工具进行样本训练。

程序课代表

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
文字识别(一) Tesseract识别与jTessBoxEditor环境搭建

一、Tesseract安装下载方式一:tesseract官方下载地址https://digi.bib.uni-mannheim.de/tesseract/其中带有dev的是开发版，不带的是稳定版，可以选择稳定版下载。下载方式二:第一种方式如果没有进行科学上网，可能下不下来，这时候可以使用第二种方式。1.进入 https://github.com/tesseract-ocr/tesseract找到如下图所示，点击2.进入到https://tesserac..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。