使用python进行文字识别

1.在anaconda prompt中安装pytesseract和pillow:  pip install pytesseract

2.安装tesseract-ocr的识别引擎 https://github.com/UB-Mannheim/tesseract/wiki

进行配置:需要在两个地方修改,参考https://www.cnblogs.com/chenshengkai/p/11318272.html

查看是否安装成功:tesseract --version

修改pytesseract.py文件,‘tesseract’修改为安装tesseract-ocrde的安装目录

3.在pycharm中编写代码

图片:

代码:

from PIL import Image
import pytesseract

image = Image.open('img/0.png')

content = pytesseract.image_to_string(image)  # 解析图片
print(content)
print("hello")

运行截图:

4.使用其他语言包

先下载语言包,可参考:https://blog.csdn.net/qq_38161040/article/details/90727456

下载完,直接放到安装位置的tessdata文件夹里就好了

使用时要在pytesseract 库的 image_to_string() 方法里加个参数lang='chi_sim'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值