MacOS python从图片中提取文字

本文介绍了在MacOS 10.14.6上,使用Python3.10进行图片文字识别时,如何解决tesseract安装及配置问题。包括安装依赖、编译tesseract源码、解决版本冲突、设置环境变量以及安装额外库以支持jpeg、png、tiff格式。
摘要由CSDN通过智能技术生成

环境:MacOS 10.14.6 python3.10。上一篇已经安装了python3.10。

本篇目标是从图片中提取文字:建立文件convertp2t.py。

from PIL import Image
import pytesseract
import os
import pdb

image_address = input(r'请输入图片地址:')
if not os.path.exists(r'{}'.format(image_address)):
        print(r'{} no exist'.format(image_address))

print(r'file name:{}'.format(image_address));
image = Image.open(r'{}'.format(image_address), 'r') #打开图片

#pdb.set_trace()
text = pytesseract.image_to_string(image, lang='chi_sim') #图片转文字
print(text) #打印结果

开始调试之路。

先后报错:

tesseract is not installed or it's not in your path

pytesseract.pytesseract.TesseractError: (2, 'Usage: pytesseract [-l lang] in

需要安装tesseract,用pip3 install tesseract,还不行。

修改/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/pytesseract/pytesseract.py,

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值