Tesseract在Center OS7/8下环境搭建
安装相关依赖
Tesseract 环境的相关依赖库涉及到的比较的多,并没有做深入的研究,安装的相关依赖如下:
yum install gcc-c++
yum install zlib-devel
yum install pkg-config
yum install libtool automake autoconf
yum install libjpeg-devel
yum install libpng-devel
yum install libtiff-devel
如果你涉及到字库的训练,还需要安装额外的工具
yum install pango pango-devel
yum install cairo cairo-devel
因为我不使用训练,所以也就不安装
1. 安装Leptonica
源码下载,地址为
因为我们是在center OS上,可直接使用命令下载
wget -c -t 20 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz
下载对应依赖库
yum install libjpeg-devel
yum install libpng-devel
yum install libtiff-devel
编译与安装
tar -zxvf leptonica-1.78.0.tar.gz
cd leptonica-1.78.0/
./configure --prefix=/usr/local/
make
make install
配置环境变量
vi /etc/profile
export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
启用环境变量
source /etc/profile
2. 安装Tesseract-OCR
源码下载,地址为
https://github.com/tesseract-ocr/tesseract/releases/tag/4.1.1
下载命令为:
wget -c -t 20 https://github.com/tesseract-ocr/tesseract/archive/4.1.1.tar.gz
编译与安装
tar -zxvf 4.1.1.tar.gz
cd tesseract-4.1.1/
./autogen.sh
./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include
make
make install
查看一下安装结果
tesseract -v
3. 配置语言包
配置语言包位置并加入环境变量
# 先新建一个目录保存traineddata数据,这个目录自己随意定义
mkdir -p /opt/Tesseract/tessdata
# 编辑profile文件
vi /etc/profile
# 注意这个路径是你自己随意定义的,但是要和上面的新建目录一样
export TESSDATA_PREFIX=/opt/Tesseract/tessdata
启用配置文件
source /etc/profile
以后将要使用的新的语言包放入此文件夹就行,下面就能安心的玩耍了