Python3.8+pytesseract+Tesseract-OCR5.0图片文字识别

最新推荐文章于 2025-03-27 19:59:31 发布

两苹果

最新推荐文章于 2025-03-27 19:59:31 发布

阅读量2.1k

点赞数 2

分类专栏： Python 文章标签： python windows opencv pytesseract tesseract

本文链接：https://blog.csdn.net/liangpingguo/article/details/108302455

版权

Python 专栏收录该内容

7 篇文章

订阅专栏

1.环境

python版本：3.8.3 （python2.7或3以上）
操作系统：windows系统

2.工具安装和配置

1.下载安装 tesseract-ocr：官网地址
2.下载安装Pycharm（下载地址：http://www.jetbrains.com/pycharm/download/#section=windows）
3.添加环境变量：TESSDATA_PREFIX = C:\Program Files (x86)\Tesseract-OCR
4.编辑文件：E:、ProgramsPython\Python38\Lib\site-packages\pytesseract\pytesseract.py

tesseract_cmd = 'tesseract'
#改为：
tesseract_cmd = 'E:/Programs/Tesseract-OCR/tesseract'

1.使tesseract-ocr与python关联，从而使python能够调用Tesseract-OCR程序识别验证码/文字，否则会处问题报错：
FileNotFoundError: [WinError 2] 系统找不到指定的文件。
2. $\ 的区分 \color{red}{注：新手一定要注意/与\backslash的区分}$

3.安装相关python包

我使用的是py3.8.3—— $\color{red}{还重装了，安装目录不要有空格哇o(╥﹏╥)o~~~~~~~}$

pip install Pillow
pip install pytesseract

4.使用

from PIL import Image
import pytesseract

# 识别的图像的字符串
print(pytesseract.image_to_string(Image.open('test.png')))
# 指定语言识别图像字符串,eng为英语
print(pytesseract.image_to_string(Image.open('test.png'), lang='test.png'))