用于图片文本识别的pytesser3的安装说明(windows10)

pytesser3包是支持python3的pytesser,后者是谷歌OCR开源项目的一个模块,在python中导入这个模块会调用tesseract, 即可将图片中的文字转换成文本。

下面讲讲pytesser3的安装问题。

1. 安装前准备

安装pytesser3之前首先需要安装好Python3, PIL库,Tesseract-OCR


2. 安装pytesser3

pytesser3可以直接使用 pip进行安装

pip install pytesser3

安装完成后,在python中输入

import pytesser3

如果没有出错的话,说明安装成功了。


3. 修改 __init__.py

修改pytesser3文件夹中的__init__.py文件。

将其中的tesseract_exe_name值设为tesseract.exe所在的文件夹路径。

tesseract_exe_name = 'D:\\tesseract\\Tesseract-OCR\\tesseract'

如果不修改的话,pytesser3将无法调用tesseract。


4. 修改util.py文件,解决'gbk'编码问题

具体内容详见:

python3 + pytesser3 识别验证码过程中‘gbk'’编码问题的解决

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值