Python中使用pytesseract(tesseract OCR)报错(TesseractNotFoundError)解决方法

在Python中使用pytesseract时遇到TesseractNotFoundError。问题在于缺少tesseract-ocr软件。解决方法是下载并安装tesseract OCR引擎,可以从指定链接下载安装包。安装完成后,在代码中指定tesseract-ocr的路径,即可成功解决报错问题。
摘要由CSDN通过智能技术生成

使用代码运行时报错

 使用pip install pytesseract

         pip install tesseract

安装之后还是不行,一样的报错

后续进行找错发现:

没有安装tesseract-ocr

OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。
Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。

链接http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe可以进行下载

安装好后,在报错代码前加上

pytesseract.pytesseract.tesseract_cmd = 'E:\\software\\Tesseract-OCR\\tesseract.exe'

后面是安装tesseract-ocr的路径

成功解决。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Pytesseract是一个PythonOCR库,可以识别图片的文本信息。然而,当我们在使用Pytesseract时,会出现“pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed”这个错误,这是因为系统没有安装TesseractTesseract是一个OCR引擎,用于文字识别。如果我们想要使用Pytesseract,必须先安装TesseractTesseract的安装过程有点繁琐,需要下载并安装Tesseract的二进制文件,并将其添加到环境变量,然后才能够在Python调用Pytesseract解决这个问题的方法就是安装Tesseract。可以在Tesseract的官网(https://github.com/tesseract-ocr/tesseract)上下载适合自己电脑系统的二进制文件,然后安装。安装成功后,需要将Tesseract添加到环境变量,以便Pytesseract能够在Python调用。 总之,一个PytesseractTesseract is not installed错误,通常是因为缺少Tesseract二进制文件或没有将其添加到环境变量。我们只需要按照官网的步骤安装Tesseract,就可以成功解决这个问题了。 ### 回答2: pytesseract是一种PythonOCR(Optical Character Recognition, 光学字符识别)库,它的作用是通过识别图片的文本来进行字符识别。在使用pytesseract库时,常常会遇到“pytesseract.pytesseract.TesseractNotFoundError: Tesseract is not installed o”的报错。 这个错误提示的意思是pytesseract无法找到安装在本地计算机tesseract程序。由于tesseract是pytesseract库的基础,因此这个错误意味着pytesseract库无法正常工作。 要解决这个问题比较简单,只需要在本地计算机安装tesseract即可。安装tesseract方法有很多,具体步骤如下: 第一步:前往tesseract官网下载相应的安装程序 tesseract官网的地址是:https://github.com/UB-Mannheim/tesseract/wiki。在该官网上找到安装程序并下载。 第二步:安装tesseract 安装程序下载后,按照提示一步一步完成安装即可。 第三步:将tesseract的安装路径添加至系统变量 完成tesseract的安装后,需要将安装路径添加到系统环境变量。如此一来,pytesseract库便可正常识别图片的字符和数字,避免了“pytesseract.pytesseract.TesseractNotFoundError: Tesseract is not installed o”的问题。 总之,通过安装tesseract程序并将其路径添加到系统环境变量,就可以摆脱“pytesseract.pytesseract.TesseractNotFoundError: Tesseract is not installed o”的报错,并正常使用pytesseract库进行图片识别。 ### 回答3: pytesseract是一个用于识别图像文字的Python库,它使用Tesseract OCR引擎进行识别。当我们在运行时出现"pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed"的错误时,这是因为我们没有安装或没有正确配置Tesseract OCR引擎在我们的系统上。 Tesseract OCR是一个开源的OCR引擎,它能够将图像的文字识别出来。但是,pytesseract作为一个Python库,需要Tesseract OCR的二进制可执行文件来运行。因此,在使用pytesseract之前,我们需要先安装Tesseract OCR。 在Ubuntu和Debian上,可以通过以下命令安装Tesseract OCR: sudo apt-get install tesseract-ocr 在Windows上,可以从官网下载安装程序进行安装,并在系统环境变量设置Tesseract OCR的路径。 在安装好Tesseract OCR之后,我们需要配置pytesseract使用正确的Tesseract OCR路径。可以通过以下代码设置: pytesseract.pytesseract.tesseract_cmd = r'/usr/bin/tesseract' 或者 pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe' 上述代码指定了Tesseract OCR的二进制可执行文件的路径。如果仍然出现"pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed"的错误,我们需要检查路径是否正确。 总之,当我们在使用pytesseract时出现"pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed"的错误时,通常是由于我们没有安装或配置Tesseract OCR引擎造成的。我们需要先安装Tesseract OCR,并正确配置pytesseract使用正确的Tesseract OCR路径。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值