pytesseract模块学习

1、使用python的pytesseract模块报错:pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it‘s not in your PATH
解决方法:去这个链接https://digi.bib.uni-mannheim.de/tesseract/下载tesseract.exe可执行程序。
2、下载完tesseract.exe后一直下一步安装就行,为了识别中文汉字,有好多教程让在安装时勾选下图的中文包,因为该安装程序中安装中文包需要下载完才能安装,亲测国内网络无法完成下载安装,所以不用勾选,直接去github上下载对应汉语包即可。
在这里插入图片描述
3、由于国内无法直接在安装tesseract.exe时下载语言包,需要去https://github.com/tesseract-ocr/tessdata这个链接下载以下四个安装包,但是由于网络原因无法直接下载,可以在这个链接下载:https://download.csdn.net/download/weixin_55091865/14987033。下载完后,把这四个中文包放到tessdata目录下。
在这里插入图片描述
4、安装完tesseract.exe后,还需要去pytesseract模块的源代码里添加tesseract.exe的路径,才能正常使用。
1.找到python的安装路径下的pytesseract: 例如我的是 E:\Python3.7.1\Lib\site-packages\pytesseract
2.用文本编辑器打开源码,查找tesseract_cmd
将原来的 tesseract_cmd = ‘tesseract’ 改为: tesseract_cmd = ‘OCR的安装路径下的tessract.exe’
例如我的是 tesseract_cmd = ‘C:\Program Files\Tesseract-OCR\tesseract.exe’
注意有的地方需要转义 例如 \tesseract.exe,或者也可直接加r转义
tesseract_cmd = r’C:\Program Files\Tesseract-OCR\tesseract.exe’

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值