windows 10安装Tesseract-OCR
下载安装包 https://digi.bib.uni-mannheim.de/tesseract/
下载后是一个exe安装包,直接双击安装即可,安装完成之后,配置一下环境变量,编辑 系统变量里面 path,添加自己的安装位置
选择安装路径
添加环境变量
将刚才的安装路径添加到path里
新建一个环境变量,名称是TESSDATA_PREFIX,值是安装路径下的tesseract文件夹路径
测试 命令行输入 tesseract -v,出现版本信息则安装成功
安装python扩展包
需要安装两个包
pip install pillow #一个python的图像处理库,pytesseract依赖
pip install pytesseract
python 测试
原图片
from PIL import Image
import pytesseract
import cv2 as cv
img_path='F:/fb/xxx.jpg'
# 不依赖opencv写法
text=pytesseract.image_to_string(Image.open(img_path))
print(text)
成功识别
手写一个数字
结果识别失败,可见tesseract的识别准确率还是很低的