python实现图片文字提取,有疑问未解决

本文讲述了作者在尝试使用Python结合Tesseract OCR工具识别图像中的中文文字时遇到的问题及解决过程。安装Tesseract并配置环境变量后,虽然能识别数字,但无法识别中文简体。尝试通过修改TESSDATA_PREFIX变量和调整路径中的斜杠仍无法解决问题,目前问题尚未解决。
摘要由CSDN通过智能技术生成

在某个微信公众号中偶然看到一个初级python实验:使用python识别并提取图像中的文字,并着手去尝试。
首先下载安装一个开源工具,Tesseract-OCR,在网上下载,我下载的是这个版本:tesseract-ocr-setup-4.0.0-alpha.20180109.exe.这个本身是一个执行文件,直击双击安装。在安装过程中可勾选安装语言库,该库支持多种语言文字的识别。
在这里插入图片描述
安装完后,要在系统变量中进行配置。在path中添加安装路径,前面的用分号隔开。在这里我将Tesseract-OCR安装在了D盘。
在这里插入图片描述
在cmd命令框中输入tesseract -v,可以检查是否安装正确。若安装无误,如下图所示:
在这里插入图片描述
安装无误后,在系统变量中添加变量TESSDATA_PREFIX,将安装路径复制进去。
在这里插入图片描述
配置完成后,进行实验。
首先导入pytesseract和pillow库。pycharm中,在se

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值