ubuntu16.04安装编译谷歌tesseract-ocr4.0(最新详细)

ubuntu16.04安装编译谷歌tesseract-ocr4.0(最新详细)

鉴于tesseract-ocr开源较早,然后安装,使用的教程都比较老了,有一些文章里面还有坑,博主也是经过不少文章的坑了。

所以!
本文介绍在linux系统下,使用 python3调用谷歌tesseract-ocr4.0来实现图像/文字识别的过程。
包括安装tesseract-ocr4.0,安装中文字体包,安装leptonica等过程。

环境:

ubuntu 16.04 x64
python 3.5
Leptonica 1.78
tesseract 4.0
(建议不要使用3.05以下版本,很多教程不适用了)

一、apt-get安装方式

如果你使用的是Ubuntu系统:可以自动安装,一键完成(但是版本就不一定是最新的,你可以在后面指定版本==4.0试试。)

sudo apt-get install tesseract-ocr

注意安装产生的文件夹:要可能是tesseract-ocr,也可能是tesseract。
默认都是安装在了/usr/share文件夹下。
自己需要先去确定!!!(我建议源码安装)

二、源码编译安装方式

根据官网所说的,最新的tesseract 4.0 及3.05,需要从Leptonica 源代码编译,而且有版本要求。

版本文档:https://github.com/tesseract-ocr/tesseract/wiki/Compiling#linux
面是3.04.10版本的安装操作方式在这里插入图片描述

1.安装leptonica库

tesseract依赖leptonica库,否则在configure的时候会提示。

源码地址:https://github.com/DanBloomberg/leptonica

请使用Git下载下来,(这都不会还玩啥linux)。然后解压文件夹。(太基础的命令就不写了)
在这里插入图片描述

然后进去文件夹,

注意了,这里跟很多老文章不一样了,

如果你发现解压的包下没有 configure 文件,只有 configure.ac文件?

打开终端,ctrl+alt+t,

找到autogen.sh或者是autoconfig.sh,执行它

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江湖一点雨

原创不易,鼓励鼓励~~~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值