Windows环境下Python使用tesseract-ocr4.1

首先需要安装tesseract-ocr,可以直接从网上下载,当然也可以使用源码编译,因为是在Python中使用,可以不需要自己从源码编译成指定的版本。因此我们直接从官网下载
打开这个网址https://github.com/UB-Mannheim/tesseract/wiki
选择tesseract-ocr-w64-setup-v4.1.0.20190314 (rc1)这个版本进行下载,tesseract-ocr 64位版本下载,下载完后进行安装,在安装的过程中我们可以选择自己需要的额外语言包,当然语言库也可以等安装后自己从网上单独下载。
在这里插入图片描述
我在这里额外选择了中文和数学的语言包
在这里插入图片描述
编辑环境变量,在path里添加tesseract.exe所在目录,对于我的电脑是E:\Tesseract-OCR4.1
在这里插入图片描述
设置语言库的环境变量,也即是tessdata目录
新建系统变量,变量名:TESSDATA_PREFIX
变量值:E:\Tesseract-OCR4.1\tessdata
在这里插入图片描述
保存退出,将电脑重启,使环境变量生效。
安装Python的tesseract库,使用命令

pip install pytesseract

有的网上教程也是用tesserocr这个第三方库,虽然tesserocr和pytesseract使用的方法完全一样,但推荐使用pytesseract。
安装成功后就可以使用了

import pytesseract
from PIL import Image
img=Image.open('test.png')
code=pytesseract.image_to_string(img,lang='chi_sim+eng')
print(code)

下图为识别结果
在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Keras深度学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值