python ocr安装_python3.7安装使用tesserocr

版权声明:本文为博主原创文章,未经博主允许不得转载。https://blog.csdn.net/Herishwater/article/details/88924338

安装tesserocr遇到的坑

环境:

win10

python3.7

一、安装Tesserocr准备

tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,所以它的核心是tesseract。因此,在安装tesserocr之前,我们需要先安装tesseract。

tesseract下载地址:http://digi.bib.uni-mannheim.de/tesseract

在Windows下,首先需要下载tesseract,它为tesserocr提供了支持。

在选择下载什么版本之前,我们需要去查看tesserocr的版本。选择安装包时,tesserocr 和 tesseract 的版本要匹配,如 “tesserocr v2.2.2 (tesseract 4.0.0 master)” 释放,表明 “tesserocr-2.2.2” 要配合 “tesseract 4.0.0 master” 使用。如果 tesserocr 与 tesseract 间版本不匹配,识别结果中会出现非预期字符。例如,若是将 “tesserocr-2.2.2” 与 “tesseract 3.5.2” 搭配使用,结果中便会出现非预期字符。

python查看当前版本支持的.whl包。

AMD64

import pip._internal

print(pip._internal.pep425tags.get_supported())

WIN32

import pip

print(pip.pep425tags.get_supported())

二、安装Tesserocr

安装tesseract可以比较简单,我们介绍一下关于tesserocr 的安装过程。

比如说:

把下载下来的tesserocr安装包放在python安装路径里,在该目录下打开dos窗口。

运行pip3 install tesserocr-2.3.1-cp37-cp37m-win_amd64.whl 即可成功。

三、验证

下面我们以如图所示的图片为样例进行测试。

我是在Pycharm中测试的,测试代码如下:

import tesserocr

from PIL import Image

image = Image.open('image.png')

print(tesserocr.image_to_text(image))

关于报错:

使用tesserocr.file_to_text("path")报错Failed to init API, possibly an invalid tessdata path

解决方法有多种,详细介绍可以参考:https://www.geek-share.com/detail/2747895506.html

如果还未解决,我本人遇到的问题是,必须要将python项目放置与python安装包同一个跟目录下。

python安装包位于D:\Soft_Install\Python37,因此这段程序必须也放在D盘。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值