之前在windows环境上部署了一套图文识别的项目,今天由于项目转移到了linux,忽然发现之前的图文识别出错了,找了度娘发现,tesseract需要在linux环境构建环境才行。好了,参考网上步骤如下:
一、查看centos版本
#cat /etc/redhat-release
CentOS release 6.5 (Final) node
二、检查gcc和g++版本
#gcc --version
#g++ --version
gcc的当前版本编译tesseract4.1会出错,须要gcc更高的版本,本人是经过yum安装的8.5.0版本,经过yum安装gcc有以下好处:
1) 安装方便,特别是不少依赖的软件包自动安装;
2) gcc的版本能够灵活切换,老的版本得以保留;
3)g++这个必须安装,因为在后续安装tesseract时需要它。
三、安装gcc 6.3.1
#yum -y install devtoolset-6-gcc devtoolset-6-gcc-c++
执行以下命令使gcc6当即生效
#source /opt/rh/devtoolset-6/enable
再次查看gcc和g++版本
#gcc --version
#g++ --version
如需永久生效则须要把命令添加到/etc/profile文件
vim /etc/profile
在最后添加以下内容:
source /opt/rh/devtoolset-6/enable
执行以下命令使之当即生效
#source /etc/profile
四、安装依赖库
#yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel
五、安装autoconf
查看本地的autoconf版本,若是太低则移除
#rpm -qa | grep autoconf
#rpm -e --nodeps autoconf-2.63
得到2.69版本autoconf
#wget ftp://ftp.gnu.org/gnu/autoconf/autoconf-2.69.tar.gz