先来说一下遇到的问题
代码如果直接运行可能会报以下错误:
raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
这时候需要修改相应文件夹路径的名称
python的安装路径下的pytesseract
我是用anaconda创建的虚拟环境中,所以我的路径是:
D:\Anaconda\envs\pytorch\Lib\site-packages\pytesseract
找到安装的文件地址后,用文本编译器打开pytesseract.py文件,修改
将原来的 tesseract_cmd = 'tesseract' 改为OCR的安装路径下的tessract.exe
但是你连OCR都没有,肯定是找不到tessract.exe的,所以这时候需要写安装OCR
tessract.exe文件安装包下载,可自行在网上搜索这个文件安装