TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.成功解决
解决步骤:
第一步:
pip install tesseract -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simple
第二步:下载tesseract-ocr,安装到F盘下。(安装成功有F:\Tesseract-OCR文件)https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.0.20221222.exe
第三步:安装成功后,添加环境变量。
1.Path中添加
F:\Tesseract-OCR\tessdata
和
F:\Tesseract-OCR
2.新建系统变量
变量名:TESSDATA_PREFIX
变量值:F:\Tesseract-OCR\tessdata
第四步:下载中文包,粘贴到如下文件夹内F:\Tesseract-OCR\tessdata。
第五步,打开Lib下site-packages下pytesseract下的pytesseract.py文件
更改tesseract_cmd=‘tesseract’
为tesseract_cmd = 'F:\\Tesseract-OCR\\tesseract.exe'
第六步:测试,Windows键+R,输入cmd回车。
输入tesseract -v和tesseract --list-langs。出现如下结果表示成功。
进一步测试,用Jupyter Notebook。
照片命名2.jpg存入D盘下,运行成功表示安装成功。
import pytesseract
from PIL import Image
image = Image.open('D:\\2.jpg')
content = pytesseract.image_to_string(image)
print(content)