一、下载tesseract后使用以下命令会出错
pip3 install tesserocr pillow
应对方法:
下载whi文件
下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
选择相应版本,我选择的是
打开Cmd,进入whl文件当前所在目录下,进行安装
pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
安装成功!
二、调用tesseract命令,“tesseract”不是内部或者外部命令,也不是可运行的程序或批处理文件
配置环境变量
成功
三、使用一下命令行进行测试时出错
tesseract image.png result -l eng && cat result.txt
错误原因:
- “cat”是Linux下的命令
应对方法:
去掉 “&& cat result.txt”,改为以下两种方式:
- 保存到文件,文件名为“result.txt”
tesseract image.png result -l eng
- 或者不保存文件,直接输出
tesseract image.png stdout -l eng
四、利用Python代码来测试遇到的一些错误的解决办法
import tesserocr
from PIL import Image
image = Image.open('image.png')
print(tesserocr.image_to_text(image))
错误一:
错误原因:
- 字符串中“\”被用作转义字符
应对方法:
可将图片文件路径改为
'C:/Users/MZ21G/Desktop/tesserocr/image.png' 或者 'C:\\Users\\MZ21G\\Desktop\\tesserocr\\image.png'
错误二:
错误原因:
- 没有把Anaconda安装到C盘
应对方法:
在C盘创建一个“Anaconda3”文件夹
将之前安装的Tesseract-OCR文件下面的“tessdata”文件夹拷贝到“C:\Anaconda3\”目录下
五、直接调用file_to_text()
方法,遇到的错误
错误原因:
- 路径参数中出现中文字符
应对方法:
路径参数不出现中文字符
六、利用python代码导入tesserocr出错
应对方法:
import locale
locale.setlocale(locale.LC_ALL, 'C')
import tesserocr