超详细解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it‘s not in yo...

1、在使用pytesseract打开图片是遇到错误,没有找到文件

    pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH

2、排查解决:

在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd ='tesseract',这里并没有指定文件路径

3、直接在pycharm中安装tesseract-cor失败 

 

4、从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):

    地址:https://github.com/tesseract-ocr/tesseract/wiki

    Windows为例:

    点击Tesseract at UB Mannheim

 找到符合自己电脑的下载

 

5、下载完后安装Tesseract-OCR 

选择自己安装的目录(要添加到环境变量里面去),一直下一步就完成了 

 6、添加到环境变量的系统变量(PATH)去

7、增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中; 

8、打开终端,输入:tesseract -v,可以看到版本信息 

9、在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成            tesseract_cmd =r'C:\Program Files\Tesseract-OCR\tesseract.exe'

    (刚才安装的路径下)

10、再去运行程序

    可以简单识别验证码,没有报错了



作者:小邝小邝
链接:https://www.jianshu.com/p/93ab58dea50f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

  • 19
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: ytesseract.pytesseract.tesseractnotfounderror: tesseract is not installed or is not in the system's path. 这个错误是由于缺少Tesseract软件引起的。Tesseract是一款开源的OCR(光学字符识别)引擎,用于将图像中的文本转换为可编辑的文本。要解决此错误,需要安装并正确配置Tesseract。 首先,确保已经下载和安装了Tesseract。你可以从Tesseract的官方网站(tesseract-ocr.github.io)上获得最新的安装程序。根据你的操作系统,选择合适的版本并进行安装。 安装完成后,需要将Tesseract添加到系统的环境变量中,以便于命令行能够找到并运行Tesseract。具体操作步骤取决于你的操作系统,一般而言可以通过以下步骤来完成: 1. 在系统的环境变量中添加Tesseract的安装路径。将Tesseract的安装路径添加到“PATH”变量中,以便系统能够在任意位置找到Tesseract的可执行文件。在Windows中,可以通过控制面板的"系统"-"高级系统设置"-"高级"-"环境变量"来完成。在Linux或Mac中,可以通过编辑.bash_profile或.bashrc文件来修改。 2. 验证是否已成功配置Tesseract。打开终端或命令提示符,运行"tesseract --version"命令,如果能够正确显示Tesseract的版本信息,则说明已经成功安装和配置。 3. 在Python中使用ytesseract库时,确保已正确安装该库。可以通过pip命令来安装:在命令行中运行"pip install ytesseract"即可。安装完成后,重新运行你的Python代码以确保ytesseract库可以正常访问Tesseract。 通过以上步骤,你应该能够解决这个错误并成功使用ytesseract库进行OCR操作了。如果问题仍然存在,你可以检查Tesseractytesseract的版本兼容性,或者在相关的社区和论坛上寻求帮助。 ### 回答2: ytesseract.pytesseract.tesseractnotfounderror: tesseract is not installed or it is not in the correct path. 这个错误通常是由于没有安装Tesseract或者Tesseract没有正确配置路径引起的。Tesseract是一个开源的OCR引擎,用于识别图像中的文本。要解决这个问题,有几个步骤可以尝试: 1. 确保已经安装了TesseractTesseract可以从官方网站https://github.com/tesseract-ocr/tesseract/releases下载并安装。根据你的操作系统,选择适当的版本进行下载和安装。 2. 确认Tesseract的安装路径是否正确。在使用ytesseract之前,需要将Tesseract添加到系统的环境变量中。你可以在终端中输入"tesseract"命令来验证Tesseract是否被正确安装和配置。 3. 如果Tesseract已经正确安装但仍然出现错误,可以尝试指定Tesseract的路径。例如,你可以在代码中使用`pytesseract.pytesseract.tesseract_cmd = '指定Tesseract的路径'`来设置Tesseract的路径。 如果你仍然无法解决这个问题,可以在Python社区或相关论坛中寻求帮助。 ### 回答3: ytesseract.pytesseract.TesseractNotFoundErrorTesseract未安装或无法找到。 PyTesseract是一个基于Python的OCR(光学字符识别)库,用于识别和提取图像中的文字。当出现上述错误时,说明系统中没有安装Tesseract或者无法找到TesseractTesseract是一个免费的开源OCR引擎,由Google开发并维护。它使用训练好的模型来识别文字,并提供了一个命令行工具和API接口供开发者使用。 要解决此问题,首先需要确保已经安装了TesseractTesseract可以在Tesseract官方网站(https://github.com/tesseract-ocr/tesseract)上下载和安装。根据不同的操作系统,可以选择合适的版本进行安装。 安装完成后,需要将Tesseract的路径配置到系统环境变量中。具体步骤如下: 1. 打开计算机的控制面板,并进入"系统和安全"部分。 2. 点击"系统"选项。 3. 点击左侧的"高级系统设置"链接。 4. 在弹出的窗口中,点击"环境变量"按钮。 5. 在"系统变量"区域,找到名为"Path"的变量,并双击打开。 6. 在弹出的编辑环境变量窗口中,点击"新建"按钮。 7. 输入Tesseract安装目录的路径,例如:"C:\Program Files\Tesseract-OCR"。 8. 点击"确定",关闭所有打开的窗口。 完成以上步骤后,重新运行程序,应该就能够解决ytesseract.pytesseract.TesseractNotFoundError错误。 如果问题仍然存在,可能是由于安装的Tesseract版本与PyTesseract不兼容。可以尝试更新PyTesseract库,或使用兼容的Tesseract版本。 总结起来,要解决ytesseract.pytesseract.TesseractNotFoundError错误,需要先确保Tesseract已正确安装,并将其路径配置到系统环境变量中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值