我安装过程遇到如下问题:
- tesseract-ocr版本不匹配
- 环境变量配置错误
- 语言包缺失
大家分析pycharm报错的内容进行针对性修改
1.版本不匹配
pytesseract.py报错,要求我版本在4.1.0以上上
修改方式:GitHub中按照要求更新相应版本
地址:https://github.com/UB-Mannheim/tesseract/wiki
(文末附安装文件)
安装步骤:
1.双击安装包
2.记住安装路径
3.配置环境变量
path | E:\soft\study\Pycharm 2020.3.3\tesseract-ocr |
---|---|
TESSDATA_PREFIX | E:\soft\study\Pycharm 2020.3.3\tesseract-ocr\tessdata |
管理员身份进入cmd执行tesseract
2.环境变量配置错误
错误:Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory.
修改方式:
TESSDATA_PREFIX 中地址是 E:\soft\study\Pycharm 2020.3.3\tesseract-ocr\tessdata
最后到 \tessdata 路径下
3.语言包缺失
错误:Failed loading language ‘chi_sim’ Tesseract couldn’t load any languages!
修改方式:
下载所需语言包到 \tesseract-ocr\tessdata 目录下
下载地址:https://tesseract-ocr.github.io/tessdoc/Data-Files
(文末附语音包文件)
https://download.csdn.net/download/weixin_45789365/85003342