linux安装图文识别(tesseract)的详细步骤(避坑)

本文详述了在Linux(CentOS 6.5)上安装图文识别工具tesseract的步骤,包括升级gcc到8.5.0,安装依赖库,安装autoconf和autoconf-archive,leptonica,以及tesseract 4.1.0。文章还提醒了安装过程中可能遇到的问题及解决方法,例如环境变量设置和语言包下载。
摘要由CSDN通过智能技术生成

之前在windows环境上部署了一套图文识别的项目,今天由于项目转移到了linux,忽然发现之前的图文识别出错了,找了度娘发现,tesseract需要在linux环境构建环境才行。好了,参考网上步骤如下:

一、查看centos版本
#cat /etc/redhat-release
CentOS release 6.5 (Final)  node

二、检查gcc和g++版本
#gcc --version
#g++ --version
gcc的当前版本编译tesseract4.1会出错,须要gcc更高的版本,本人是经过yum安装的8.5.0版本,经过yum安装gcc有以下好处:
1) 安装方便,特别是不少依赖的软件包自动安装;
2) gcc的版本能够灵活切换,老的版本得以保留;

3)g++这个必须安装,因为在后续安装tesseract时需要它。

三、安装gcc 6.3.1
#yum -y install devtoolset-6-gcc devtoolset-6-gcc-c++
执行以下命令使gcc6当即生效
#source /opt/rh/devtoolset-6/enable
再次查看gcc和g++版本
#gcc --version
#g++ --version

如需永久生效则须要把命令添加到/etc/profile文件
vim /etc/profile
在最后添加以下内容:
source /opt/rh/devtoolset-6/enable
执行以下命令使之当即生效
#source /etc/profile

四、安装依赖库
#yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel

五、安装autoconf
查看本地的autoconf版本,若是太低则移除
#rpm -qa | grep autoconf
#rpm -e --nodeps autoconf-2.63

得到2.69版本autoconf
#wget ftp://ftp.gnu.org/gnu/autoconf/autoconf-2.69.tar.gz

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

余额很不足

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值