pycharm安装pytesseract,进行图片文字识别

在尝试使用pytesseract进行图片文字识别时遇到了安装和配置问题。首先通过pip安装pytesseract,然后安装Pillow和Tesseract-OCR并配置环境变量。在遇到tesseract未找到的问题后,修改pytesseract.py文件中的tesseract_cmd路径。尽管成功运行,但识别准确率不高,后续需要研究提高识别精度的方法。
摘要由CSDN通过智能技术生成

今天使用pytesseract包进行自动化验证登录时,对pytesseract进行下载,其中出现了很多的问题,我直接先使用命令:pip install pytesseract进行下载,下载成功
在这里插入图片描述
然后测试看看能不能识别出图片中的文字,然后报错
在这里插入图片描述
查阅了资料发现还要安装pillow和Tesseract-OCR
下载Tesseract-OCR链接:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
然后一路默认安装就行
配置环境变量:在你环境变量里添加你安装Tesseract-OCR的路径,然后再运行代码,
在这里插入图片描述
我这里运行代码后,还是报错说tesseract没有安装或者不在PATH中,再继续百度,pytesseract安装后,在python的Lib目录下site-packges下会生成一个pytesseract文件夹,文件夹中找到pytesseract.py,路径为:D:\Python36\Lib\site-packages\pytesseract,使用记事本打开pytesseract.py,找到如下两行:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

将tesseract_cmd = 'tesseract’修改为:tesseract_cmd = ‘你安装tesseract的路径’,我的就是tesseract_cmd = ‘D:\tesseract-ocr\tesseract.exe’
表示tesseract_cmd配置的是你安装tesseract的绝对路径,这样就能找到tesseract了。修改后保存,再去运行python代码,就可以成功了。
不过最终这准确度不是很高呀,后面需要再多学习一下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值