python安装成功是什么样的图片_python3图像识别库安装与使用

pytesseract库的安装

因为用的win10,就直说windows上面的安装了。其实就是pip安装就完事了。

$ pip install pytesseract

安装了这个还不算完,得安装Tesseract-OCR,安装这个软件的时候,因为我们需要识别中文,所以还需要额外安装中文语言包:

30259788.jpg

点击Additional language data(download)旁边的加号,勾选中文语言包,然后就一路Next了:

9532060.jpg

最后,你还可以将tesseract.exe加进系统的Path里面。

简单使用

pytesseract不仅支持英文,还支持很多其他语言,从上面安装过程中勾选的地方就能看出来,中文,也不例外。

要使用pytesseract,其实很简单:

from PIL import Image

import pytesseract

image = Image.open('pic2.png')

imtext = pytesseract.image_to_string(image,lang='chi_sim')

print(imtext)

看起来是没什么问题的,但是一运行。。。。

C:\ProgramData\Anaconda3\python.exe F:/python/pro/Pic_t/test.py

Traceback (most recent call last):

File "F:/python/pro/Pic_t/test.py", line 5, in

imtext = pytesseract.image_to_string(image,lang='chi_sim')

File "C:\ProgramData\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line 125, in image_to_string

raise TesseractError(status, errors)

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata')

Process finished with exit code 1

就报错了,这里看来是中文的语言训练集路径不对,google了一下,有大神说使用config属性:

from PIL import Image

import pytesseract

image = Image.open('pic2.png')

# 指定路径

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'

imtext = pytesseract.image_to_string(image,lang='chi_sim',config=tessdata_dir_config)

print(imtext)

运行了一下,成功了。。。

另外,lang这个属性是指定语言的,要是代码里面不给这个参数,默认是英文,也就是eng。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值