python-图片文字识别(一)

目录

环境安装及配置

代码演示


下篇:python-图片文字识别(二)

环境安装及配置

安装PIL:pip install Pillow

安装pytesseract:pip install pytesseract

tesseract-ocr插件安装

下载地址https://digi.bib.uni-mannheim.de/tesseract/

安装:选择汉语言包(下面包括中文简体和繁体的横排和竖排

pytesseract.py文件配置

安装后,在pytesseract.py文件中修改tesseract_cmd的值为tesseract.exe所在的路径。

try:
    from PIL import Image
except ImportError:
    import Image

# tesseract_cmd = 'tesseract'
tesseract_cmd = r'D:\OCR\tesseract.exe'  # 安装后tesseract-ocr,tessdata同目录下的tesseract.exe所在路径

代码演示

import pytesseract
from  PIL import Image

image = Image.open(r'C:\Users\Administrator\Desktop\001.png')  # 图片文件所在位置
print(image.size)  # 可以打印图片的大小
txt = pytesseract.image_to_string(image,lang='chi_sim')  # 英文默认lang参数为eng,可以不指定,中文指定参数lang='chi_sim'(简体中文),lang='chi_tra'(繁体中文)
print(txt)

  

没有安装中文语言包的需要额外下载,下载后的语言包放到tessdata目录下。文字识别结果往往会存在出入

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值