Linux(CentOS7) 安装 Tesseract

Linux 安装 Tesseract

PS:语言包一般安装好后就自带三个,够用了,支持中英文。三个训练包名称

// 支持中文
chi_sim.traineddata
// 支持中文繁体
chi_tra.traineddata
// 支持英文
eng.traineddata

安装版本(自己找自己合适的,我装高版本失败了提示 C++ 版本不够就换低版本了

Tesseract 4.1.3
// leptonica 必须版本要 >= 1.74.4
leptonica 1.74.4 

安装路径(自定义,最好在 /usr/local 目录下

/usr/local/tesseract

安装依赖

yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel gcc gcc-c++

安装 leptonica

mkdir  /usr/local/tesseract
// 将下载的 leptonica 文件上传到 /usr/local/tesseract 并解压
tar -xzvf leptonica-1.74.4.tar.gz
cd leptonica-1.74.4.tar.gz
./configure --prefix=/usr/local/leptonica  && make  && make install

配置 leptonica 环境变量

  • find / -name “leptonica” 2>/dev/null 查找下 leptonica 安装到了哪里。WTF?!有多个用哪个???!!!
    在这里插入图片描述
  • 哪个有如下图所示的各种 .h 文件用哪个。好几个都有???随便用一个,但是配置环境遍历时候只需要配置到 leptonica 上一级目录。如 /usr/local/include/leptonica 有 .h 文件,那么配置环境变量时候就只需要配置到 /usr/local/include ,不要配置到 /usr/local/include/leptonica 。
    在这里插入图片描述
  • 再查找下 find / -name “pkgconfig” 2>/dev/null 查找下 pkgconfig 安装哪里。尼玛!又有多个用哪个???!!!
    在这里插入图片描述
  • 哪个有如下图所示的 .pc 文件用哪个。也可以直接 find / -name “tesseract.pc” 2>/dev/null 查找 tesseract.pc 文件在哪个目录
    在这里插入图片描述

配置 leptonica 环境变量

// 配置 leptonica 环境变量
vim /etc/profile

# Tesseract 依赖 leptonica
# 固定配置:不管安装到哪里也是这么配置,别乱配路径
export LD_LIBRARY_PATH=/usr/local/lib
# 下面两个跟着上面所示配置
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

source /etc/profile

安装 tesseract

// 将下载的 tesseract 文件上传到 /usr/local/tesseract 并解压
tar -xzvf tesseract-4.1.3.tar.gz
cd tesseract-4.1.3.tar.gz
./autogen.sh
// 这是配置 leptonica 环境变量的路径,但是这里要包含 leptonica 目录,配置环境变量是不用包含到 leptonica 目录
./configure --with-extra-includes=/usr/local/include/leptonica --with-extra-libraries=/usr/local/include/leptonica
make
make install
ldconfig

进行 ./configure 时候疯狂报错(那就是 leptonica 环境变量没有配置好!!!

configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package

配置 tesseract 环境变量

  • find / -name “tessdata” 2>/dev/null 查找下 tessdata 安装到了哪里。有多个用哪个???!!!用安装过程中生成到 /usr/local/share/tessdata 那个,下面那个是我自定义的安装路径不用管它
    在这里插入图片描述
    配置 tesseract 环境变量
// 配置 tesseract 环境变量
vim /etc/profile

# Tesseract 语言训练包
# find / -name "tessdata" 2>/dev/null 查出来安装过程中生成的路径
export TESSDATA_PREFIX="/usr/local/share/tessdata"
# 固定配置:不管安装到哪里也是这么配置,别乱配路径
export PATH="$PATH:/usr/local/bin"

source /etc/profile

测试tesseract-ocr4.0是否可用

// 查看版本
tesseract --version
// 使用说明
tesseract
// 所支持的语言列表
tesseract --list-langs

执行 tesseract --list-langs 疯狂报错(那就是 tesseract 环境变量没有配置好!!!

tesseract: genericvector.h:761: T& GenericVector<T>::operator[](int) const [with T = char]: Assertion `index >= 0 && index < size_used_' failed.
Aborte

安装好就完事了,没有什么启动脚本之类的,直接查看效果

  • 识别图
    在这里插入图片描述

  • 效果图

在这里插入图片描述

  • 20
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值