背景:我确保已经安装了pytesseract,并且将tesseract的安装路径添加到系统的PATH环境变量中,anaconda3运行相关代码成功,但是pycharm不能运行相关代码,显示pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH. See README file for more information.
参考链接解决环境路径的几种方法
具体过程为下载安装Tesseract-OCR.exe
此时在anaconda3可以运行下面代码:
import re
import pytesseract
from PIL import Image
def demo():
# 打开要识别的图片
image = Image.open(r"C:\Users\23934\Desktop\520\代码\方法\222\111.jpg")
# 使用pytesseract调用image_to_string方法进行识别,传入要识别的图片,lang='chi_sim'是设置为中文识别,
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)
if __name__ == '__main__':
demo()
但是pycharm运行以上代码提示标题路径问题
1 在实际代码中添加以下代码:
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"
或者类似的路径:
pytesseract.pytesseract.tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'
由于pycharm用的anaconda3自带的python,C:\ProgramData\Anaconda3\Lib\site-packages\pytesseract目录下pytesseract.py文件没有,于是使用带管理员权限的anaconda Prompt使用命令pip install pytesseract得到了pytesseract.py文件的安装位置。(之前已经安装过需要的库了,泪奔)
将源码中的:tesseract_cmd = ‘tesseract’
改为:tesseract_cmd = ‘C:\Program Files (x86)\Tesseract-OCR\tesseract.exe’
pycharm就可以运行成功了,不知道为何添加环境变量这种方式不成功。