安装tesseract-ocr

下载tesseract-ocr网址:https://github.com/UB-Mannheim/tesseract/wiki

去上面这个网址可以找到如上图,有32位和64位还有以前版本,推荐4.0.0版本,下载完成之后,傻瓜式安装

找到中文语言识别包,添加上中文简体和常用数学公式和英语,然后点击下一步,记住你安装的路径,因为接下来要配置环境变量

配置环境变量:1、文件资源管理器中选中此电脑->右键属性打开界面->点击高级系统设置->在打开的系统属性界面点击环境变量->在环境变量界面选择系统变量中选中path,然后点下面的编辑,打开编辑环境变量界面新建一个C:\Program Files (x86)\Tesseract-OCR的值,然后确定

2、

在系统变量下面点击新建,按照如图建一个变量如图

变量名TESSDATA_PREFIX

变量值C:\Program Files (x86)\Tesseract-OCR\tessdata

,然后点击确定,之后界面依次点击确定,完成设置。变量建立完成。

 

然后打开cmd ,输入tesseract   ,出现如下图,则安装成功

 

然后要安装pytesseract,这个比较简单,直接pip install pytesseract

找到你安装的路径C:\Users\14197\AppData\Roaming\Python\Python36\site-packages,然后修改pytesseract\pytesseract.py里面的文件

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

修改为:你的tesseract.exe的安装路径

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe')

然后pycharm运行,大功告成!

 

 

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Tesseract-OCR是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以用于将图像中的文字转换为可编辑的文本。下面是安装Tesseract-OCR的步骤: 1. 首先,你需要下载并安装Tesseract-OCR引擎。你可以从Tesseract的官方GitHub页面(https://github.com/tesseract-ocr/tesseract)上找到最新的版本。根据你的操作系统,选择相应的安装包进行下载。 2. 安装完成后,将Tesseract-OCR添加到系统的环境变量中。这样你就可以在任何位置使用Tesseract命令。 3. 接下来,你需要下载训练数据文件(语言数据)。Tesseract支持多种语言,你可以从Tesseract的官方GitHub页面上找到相应的语言数据文件。下载完成后,将其放置在合适的位置。 4. 现在,你可以在命令行中使用Tesseract命令来进行OCR识别了。例如,你可以使用以下命令来识别一张图片中的文字: ``` tesseract image.png output -l eng ``` 这个命令将会将名为image.png的图片中的文字识别并保存到名为output.txt的文本文件中。`-l eng`参数指定了使用英语语言进行识别。 5. 如果你想在编程中使用Tesseract-OCR,可以选择适合你编程语言的Tesseract库或API。Tesseract提供了多种语言的接口,如Python、Java、C++等。你可以在Tesseract的官方文档中找到相应的使用方法和示例代码。 希望以上信息对你有所帮助!如果你还有其他问题,请继续提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值