Python识别图像中的文字

按步骤……….
一步一步来
一、配置运行环境
1、安装PIL:pip install Pillow
2、安装pytesseract:pip install pytesseract
3、安装Tesseract-OCR:https://github.com/UB-Mannheim/tesseract/wiki (进入网页下载安装包)
(1)安装Tesseract-OCR可以直接使用傻瓜安装法,但是在选择语言那一步一定要选中文,不然会报错
这里写图片描述
(中文选项在最后一个选项里,可以直接选择最后一项全部安装,非常耗时;也可以只选择自己需要的几种语言)
是不是觉得可以用了? 不!还得接着配置。
(2)、打开源代码
这里写图片描述
(我用的是pycharm)
选中pytesseract,然后Ctrl+B进入它的*__init.py__文件,接着选中pytesseract然后Ctrl+B
这里写图片描述
修改文件里的路径(以自己安装的为主)
这里写图片描述

(3)、这并没有结束,来来来,我们接着配置:
设置环境变量 TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata
(如何配置环境变量:此电脑右键=》属性=》高级系统设置=》右下角“环境变量”)
这样就算是安装完成了,如果出错了……………….那你重启一下(可能是环境变量的原因)

终于大功告成
二、代码部分

#coding=utf-8
from PIL import Image
import pytesseract
Img = Image.open('output/3.jpg')
text=pytesseract.image_to_string(Img,lang='chi_sim')
print(text)

三、效果如下
个别字还是有错~_~
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值