1、使用pytesseract读取图像文件,找不到文件
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH
2、从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):
地址:Home · UB-Mannheim/tesseract Wiki · GitHub
注:官网已停止维护,只能下载以前的版本
Windows为例:
点击tesseract-ocr-w64-setup-v5.2.0.20220712.exe
3、下载完后安装Tesseract-OCR
4、 添加到环境变量的系统变量(PATH)去(路径填Tesseract-OCR 的安装路径)
5、增加一个TESSDATA_PREFIX变量名,变量值为Tesseract-OCR 的安装路径;
6、打开终端,输入:tesseract -v,可以看到版本信息
7、在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成 tesseract_cmd = r'E:\Program Files\Tesseract-OCR\tesseract.exe'
8、再去运行程序