python提取图片文字_python实现提取图片中文字

1

首先我贴出代码:

from PIL import Image

import pytesseract

text=pytesseract.image_to_string(Image.open('demo.png'),lang='chi_sim')

print(text)

b87bd38920c5260f02b65e3fd2de4507890189d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

2

然后给出我的项目目录,以及图片信息,和最后的运行结果

89402670d5413a8c348b26ba1ffc508c9ace81d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

a44e8afc508c9bce507b09c2d6dd884ce44afad8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

5c9c964ce54a2f277a6cabb3e00192dd3240f4d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

3

但是就这样去运行肯定不会对的,需要去安装相应的模块:

首先安转pytesseract模块:在命令行中pip install pytesseract

6a408cdd3340b6f3320480a912c0affce086eed8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

4

安装PIL模块,我直接使用pip install PIL出错了,是因为官方给出的PIL是32位的,但是我电脑是64位的,所以去下载Pillow-6.0.0-cp36-cp36m-win_amd64.whl这里cp36是我的python版本为3.6,请根据自己版本下载

9881b1fce186242f01f117aa35e434daf15ee8d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

5

下载好之后,我们先安装wheel模块,然后安装刚才下载的文件

f11f54237971fe1d275b9bacea20a7cd0d6ee0d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

6

在所需要的模块安装好之后,可能运行还是回出错,所以需要下载识别引擎tesseract-ocr

0d2fe5f202b375d720f83841515872dadf49d8d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

7

下载好之后,我们就安装好它,然后设置pytesseract使用该识别引擎

739bc049610f8b566d87addd9ce951e10ff8d3d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

50a010f85856d53d6fa75b5c47d2bb665059cad8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

8

最后就基本ok了,但是如果要要识别中文,就需要下载 tesseract-ocr的中文语言包了。总结而言,就是两个模块的安装,然后识别引擎的安装与配置,还有相应的语言包

END

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值