配置了一下午的tesseract,总算配置好了,发文纪念一下,当做笔记也给后来的人避免踩坑,由于我调试好了才发文,所以没有错误的截图了,只能口述问题
首先是安装tesseract的安装包,我这里使用的是4.0.0,下载链接
https://digi.bib.uni-mannheim.de/tesseract/
然后一路next,记住自己的安装路径就行了,把tesseract安装好,要想在python中使用tesseract还得使用第三方库pytesseract,我使用的IDE是pycharm,所以直接在setting里安装好了pytesseract。
这时运行程序会出现第一个问题,报错找不到tesseract的执行文件
在安装好pytesseract之后打开pytesseract的源文件,在文件开头的
tesseract_cmd = ''
将你安装的tesseract的exe的绝对文件路径输入进去
继续运行会出现第二个错误,反映数据库找不到语言包,这时需要设置环境变量,搜索栏搜索高级系统设置,打开,点击环境变量,在用户变量和系统变量的Path中添加变量值TESSDATA_PREFIX,变量路径一直到tessdata的上一级路径,切记没有tessdata,是他的上一级路径
设置好后并不会马上生效,重启系统之后即可正常使用