关于崔庆才老师python3爬虫中tesserocr安装以及测试中出现Failed to init API, possibly an invalid tessdata path的完整解决方案

本文介绍了在安装和使用Python3爬虫库tesserocr时,如何处理tessdata路径错误的问题。通过详细步骤,包括安装tesseract、配置环境变量、复制tessdata文件夹、安装pytesseract和tesserocr包,以及测试安装成功的全过程。
摘要由CSDN通过智能技术生成

1 我假设大家都安装了anaconda,因为我用的anaconda3,安装目录是 D:\ProgramData\Anaconda3;
2 安装tesseract,地址是 https://digi.bib.uni-mannheim.de/tesseract/,我安装的3.05.02稳定版,注意,安装盘一定要和anaconda3是同一个盘,如果不是同一个盘,就会造成题目中出现的不合法路劲的错误,我是安装在根目录下的,建议大家和我一样,以免出现其他问题,我的目录是:D:\Tesseract-OCR
3 配置环境变量,将D:\Tesseract-OCR添加到环境变量的系统变量中的path中,并且新建TESSDATA_PREFIX变量,值为tessdata的路径,我的是D:\Tesseract-OCR\tessdata;
4 复制tessdata文件夹到Anaconda3目录下;
5 电脑左下角开始菜单点开anaconda3-anaconda prompt,这个cmd打开一般就是python的base环境,然后
pip install pytesseract (我不确定这个包是不是一定要安装,反正我安装了),然后
conda install -c simonflueckiger tesserocr (可能比较慢,取决于你的网络),安装完以后重启电脑,注意,win10

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值