1.说明
1)Python版本:3.x
2)安装PIL、pytesseract
3)安装识别引擎tesseract-ocr
1)Python版本:3.x
2)安装PIL、pytesseract
3)安装识别引擎tesseract-ocr
4)测试两张图片,denggao.jpg(中文信息)、test.jpg(英文信息)
2.安装操作
1)进入cmd界面,执行以下两行命令,进行PIL和pytesseract的安装(界面可看安装进度条):
pip install PIL
pip install pytesseract
2)测试安装成功与否,在Python界面执行以下语句,不报错即安装成功:
from PIL import Image
import pytesseract
3.安装好PIL和pytesseract之后,运行下面代码:
# # 对于中文信息的提取,需要加lang='chi_sim',调用中文词库
from PIL import Image
import pytesseract
text=pytesseract

这篇博客介绍了如何利用Python的PIL和pytesseract库来识别图片中的中文和英文信息。首先,通过pip安装PIL和pytesseract,然后检查安装是否成功。在处理中文信息时,需要设置lang='chi_sim'。如果遇到错误,可能是图片路径错误或缺少识别引擎tesseract-ocr。解决这些问题后,通过配置tesseract-ocr的路径,最终能够成功从图片中提取文字。
最低0.47元/天 解锁文章
397

被折叠的 条评论
为什么被折叠?



