CentOS7下编译安装tesseract-ocr

本次安装的软件版本及下载地址

1、tesseract-ocr 3.04

      地址:wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

 2、leptonica-1.72

    地址:http://www.leptonica.com/source/leptonica-1.72.tar.gz

安装步骤

1、首先安装leptonica依赖包

执行命令:

yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

2、编译安装leptonica

执行命令步骤:

1)下载

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

2)解压

tar -xzvf leptonica-1.72.tar.gz 

3)编译

cd leptonica-1.72 /*进入解压后的文件*/
./configure

4)安装

make && make install
3、编译安装Tesseract-ocr3.04.00.tar.gz

1)下载

wget wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

2)解压

tar -xvzf  3.04.00.tar.gz  

3)编译

cd tesseract-3.04.00
./configure

4)安装

make && make install
5)上传语言识别库,我用的是英文和中文识别库

下载地址:https://codeload.github.com/tesseract-ocr/langdata/zip/master

将将语言库中eng下的所有文件上传到/user/local/share/tessdata下面

下载识别库:https://raw.githubusercontent.com/tesseract-ocr/tessdata/master该路径下面有所有的识别库

下载:eng.traineddata  chi_sim.traineddata

将这两个库也上传到/user/local/share/tessdata下面。

4测试

这是我要识别的图片

执行命令:tesseract 2.jpg out -l chi_sim

找到out.txt文件打开我的内容是

已影响63人加入全民阅读行列超过了99%的用户



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

StruggleRookie

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值