Python安装tesserocr遇到的一些问题

一、下载tesseract后使用以下命令会出错

pip3 install tesserocr pillow

应对方法:

下载whi文件

下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

选择相应版本,我选择的是

打开Cmd,进入whl文件当前所在目录下,进行安装

pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl

安装成功!

二、调用tesseract命令,“tesseract”不是内部或者外部命令,也不是可运行的程序或批处理文件

配置环境变量

成功

三、使用一下命令行进行测试时出错

tesseract image.png result -l eng && cat result.txt

错误原因:

  • “cat”是Linux下的命令

应对方法:

去掉 “&& cat result.txt”,改为以下两种方式:

  • 保存到文件,文件名为“result.txt”
tesseract image.png result -l eng

  • 或者不保存文件,直接输出
tesseract image.png stdout -l eng

四、利用Python代码来测试遇到的一些错误的解决办法

import tesserocr
from PIL import Image
image = Image.open('image.png')
print(tesserocr.image_to_text(image))

错误一:

错误原因:

  • 字符串中“\”被用作转义字符

应对方法:

可将图片文件路径改为

'C:/Users/MZ21G/Desktop/tesserocr/image.png'  或者  'C:\\Users\\MZ21G\\Desktop\\tesserocr\\image.png'

错误二:

错误原因:

  • 没有把Anaconda安装到C盘

应对方法:

在C盘创建一个“Anaconda3”文件夹

将之前安装的Tesseract-OCR文件下面的“tessdata”文件夹拷贝到“C:\Anaconda3\”目录下

五、直接调用file_to_text()方法,遇到的错误

错误原因:

  • 路径参数中出现中文字符

应对方法:

路径参数不出现中文字符

六、利用python代码导入tesserocr出错

应对方法:

import locale
locale.setlocale(locale.LC_ALL, 'C')
import tesserocr

参考链接:https://github.com/sirfz/tesserocr/issues/137

  • 18
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值