pytesseract库的安装和使用

最新推荐文章于 2024-09-13 22:24:28 发布

鹿鸣悠悠

最新推荐文章于 2024-09-13 22:24:28 发布

阅读量1.2k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/weixin_41665637/article/details/113651111

版权

python 专栏收录该内容

149 篇文章 4 订阅

订阅专栏

使用，就是可以把图片文字自动提取出来，然后识别图片

安装步骤：https://www.cnblogs.com/wenqiang-leo/p/13962265.html

备注：补充，按如上配置后会一直报错，原因是tesseract的tessdata库还要在继续的下载一个包
包的地址：
https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

在这里插入图片描述
将包解压缩后，存放在D:\tool-work\Tesseract-OCR\tessdata文件下

运行脚本就可以了

import pytesseract
from PIL import Image
image = Image.open(r'D:\pythonProject1\venv\lib\site-packages\pytesseract\1.jpg')#这里地址是指识别的图片地址
text = pytesseract.image_to_string(image,lang='chi_sim') #使用简体中文解析图片
print(text)