解决windows使用pytesseract的几个BUG(tesseract.exe is not installed or it's not in your PATH)

  1. 正常安装pytesseract时没有任何问题的,但是在真正使用的时候就会报错:
    在这里插入图片描述
pytesseract.pytesseract.TesseractNotFoundError: tesseract.exe is not installed or it's not in your PATH

pytesseract未安装或者不在指定路径,百度了一大堆,说什么要添加路径:

tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

但实际上你需要先下载Tesseract-OCR,我这里给出windows下各版本的下载链接(【注意】要3.0以上才支持中文):

https://digi.bib.uni-mannheim.de/tesseract/

然后我们在pytesseract.py文件中添加路径,这个文件在你的python安装目录下的:\Lib\site-packages\pytesseract 目录下

在这里插入图片描述

  1. 第二个BUG出来了:
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

在这里插入图片描述

这里给出最后的解决方法:

在你的运行代码中,先加上这两段代码:

pytesseract.pytesseract.tesseract_cmd = 'c://Program Files (x86)//Tesseract-OCR//tesseract.exe'

tessdata_dir_config = '--tessdata-dir "c://Program Files (x86)//Tesseract-OCR//tessdata"'

手动指定路径。然后在使用pytesseract.image_to_string()方法的时候在指定配置:

pytesseract.image_to_string(im, lang ='eng', config=tessdata_dir_config)

给出完整代码:

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = 'c://Program Files (x86)//Tesseract-OCR//tesseract.exe'

tessdata_dir_config = '--tessdata-dir "c://Program Files (x86)//Tesseract-OCR//tessdata"'

im = Image.open('./ccc.png')
print(pytesseract.image_to_string(im, lang ='eng', config=tessdata_dir_config))

运行之后:
在这里插入图片描述
虽然并没有正确识别出来,但至少没有报错

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值