**
第一步 安装
下载安装包
Tesseract的安装我们可以移步到该网址 https://digi.bib.uni-mannheim.de/tesseract/
或者网盘下载
https://pan.baidu.com/s/1YQCMnx-wCeNrJEE3wcEnQA 提取码:rbc6
第二步 配置环境变量
这里需要配置2个环境变量
第一个是Tesseract的path 比如你的路径是D:\CodeField\Tesseract-OCR。
第二个是添加TESSDATA_PREFIX的环境变量,设置为安装目录下的tessdata目录 这个环境变量不添加就会报错Error opening data file Tesseract-OCR\tessdata/eng.traineddata问题
第三步 安装模块配置py文件
在python终端输入 pip install pytesseract 安装模块
pip install pillow 安装图片处理模块
打开pytesseract.py文件,在该文件中找到以下代码:
对画红圈的地方中的‘tesseract’修改为安装tesseract-ocrde的安装目录:
D:\Program Files (x86)\Tesseract-OCR
配置完成 可以写个代码测试一下
import pytesseract
from PIL import Image
im = Image.open(‘sentence.jpg’)
string = pytesseract.image_to_string(im)
print(string)