文章目录
tesseract-ocr
1、tesseract-ocr下载安装
1.1 下载地址
https://digi.bib.uni-mannheim.de/tesseract/
下载慢可百度网盘下载:
链接:https://pan.baidu.com/s/1v0k-aPv3sVGhmjV5lp7dxg?pwd=q6kk
提取码:q6kk
1.2 安装tesseract
双击exe文件直接下载:
记得勾选Additional language data(download)下载语言包
注:我这里的安装路径为A:\APP\Tesseract-OCR
1.3 将tesseract添加到系统环境变量
2、安装pytesseract包
pip install pytesseract
3、配置pytesseract
利用pip show pytesseract查看该包安装在哪
找到下载的pytesseract包的pytesseract.py文件,修改一下配置:
1)增加tessdata文件的路径变量:
tessdata_dir_config = r’–tessdata-dir “A:\APP\Tesseract-OCR\tessdata”’
2)修改tesseract_cmd = ‘tesseract’为:
tesseract_cmd = r’A:\APP\Tesseract-OCR/tesseract.exe’
3)将tessdata_dir_config变量添加到image_to_string函数中
4、pytesseract实例测试
from PIL import Image
import pytesseract
file_path = "test.jpg"
image = Image.open(file_path)
print(pytesseract.image_to_string(image))
测试图片为:
结果:
有问题可私信解答。