关闭

【OCR】CentOS7下编译安装tesseract-ocr

标签: centosocrtesseractgithub
6284人阅读 评论(6) 收藏 举报
分类:

什么是tesseract-ocr

OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。

Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。

现在托管在GitHub中~

源代码位置

托管于 http://code.google.com/p/tesseract-ocr/
目前项目转移到GitHub https://github.com/tesseract-ocr

下载源代码

最终选定的是托管在GitHub上的3.0.2分支

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.zip

编译安装


unzip 3.04.zip
cd tesseract-3.04/
./configure

安装leptonica

报错:

leptonica... configure: error: leptonica not found

解决方案: 安装 leptonica
官网地址: http://www.leptonica.org/download.html

 wget http://www.leptonica.org/source/leptonica-1.72.tar.gz
 tar xvzf leptonica-1.72.tar.gz
 cd leptonica-1.72/
 ./configure
  make && make install

完成安装

./configure
make && make install
sudo ldconfig

配置文件位置

/usr/local/share/tessdata

语言文件

文件源码

我们需要下载支持的语言对应的配置中
GitHub地址 https://github.com/tesseract-ocr/langdata

修改变量

创建存放语言文件的文件夹 /usr/local/share/tessdata/lang
修改配置的变量 export TESSDATA_PREFIX=/some/path/to/tessdata

这里注意的是,我们修改的是路径的前缀,真实的语言文件的路径实际是/usr/local/share/tessdata/lang/tessdata

否则就会出现下面的错误

这里写图片描述

放到配置文件夹

解压之后放到语言配置文件夹中
wget https://github.com/tesseract-ocr/tessdata/archive/master.zip

使用

准备测试图片

这里写图片描述

上传到测试服务器

scp code.jpg root@xxx.xxx.xx.xx:/data/

验证

tesseract /data/code.jpg out

查看结果

cat out.txt

0376

安装完成,验证正确~

)

参考资料

2
0
查看评论
发表评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场

CentOS7下编译安装tesseract-ocr

本次安装的软件版本及下载地址 1、tesseract-ocr 3.04       地址:wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz  2、leptonica-1...
  • StruggleRookie
  • StruggleRookie
  • 2017-05-11 12:06
  • 1908

CentOS下编译安装tesseract-ocr

作为在最流行的免费linux发行版本来说,centos自带的yum真不给力啊,连tesseract-ocr都没有。 安装tesseract,首先安装一些依赖的库 1 2 3 4 wget http://www.leptonica.com/source/leptonic...
  • torrytang
  • torrytang
  • 2015-01-26 01:37
  • 2566

CentOS 6.3 下build tesseract

参考:https://code.google.com/p/tesseract-ocr/wiki/Compiling 安装Dependencies: yes | yum install libpng-devel.x86_64 yes | yum install libjpe...
  • yasi_xi
  • yasi_xi
  • 2013-03-04 20:44
  • 4530

linux 安装Tesseract-OCR

安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)   1 yum install gcc gcc-c++ make  依赖的包: autoconf automake libtool l...
  • cxf7394373
  • cxf7394373
  • 2014-03-03 13:56
  • 9334

Centos下编译安装TESSERACT3.0.x版本

1.首先我们来安装TESSERACT所需要的依赖库leptonica tar -zxvf leptonica-1.69.tar.gz cd leptonica-1.69 ./configure make&&make install 2. 依赖安装完毕后开始安装tesseract...
  • chenzenan
  • chenzenan
  • 2015-03-26 10:20
  • 1445

tesseract的编译安装

需要安装: apt-get install autoconf apt-get install automake apt-get install libtool ---------------------------------------------------------------------...
  • wxcdzhangping
  • wxcdzhangping
  • 2016-04-14 16:28
  • 6646

Centos下实现使用tesseract破解验证码

实现使用tesseract实现自动识别验证码,然后使用python搭建守护进程进行监听。
  • qq625281334
  • qq625281334
  • 2016-11-16 09:57
  • 191

在centos6.5下安装tesseract3.02

准备工作: 编译环境:gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yuminstall gcc gcc-c++ make   1.依赖的包:autoconf automake libtool libjpeg-devellibpng-devel libtif...
  • lilin020401
  • lilin020401
  • 2014-10-19 01:18
  • 477

tesseract4.0:ubuntu16.04 +x64+leptonica1.74.4源码安装(ViewerDebugging)工具记录

!!!tesseract官网有提供相关视频!!! https://www.youtube.com/watch?v=vOdnt2h1U8U https://www.youtube.com/watch?v=WZLJucXZy-g !!!官网编译教程!!!建议完整看完后再作操作。 https://...
  • u013985291
  • u013985291
  • 2017-09-27 15:58
  • 1068

Linux——完全安装Tesseract环境

我这里使用的是Red Hat 6.2 版本 1. 安装依赖包 依赖包一共包括: autoconf automake libtool libjpeg libpng libtiff zlib libjpeg-devel libpng-devel libtiff-devel zlib-deve...
  • u012476249
  • u012476249
  • 2016-12-01 16:35
  • 3796
    个人资料
    • 访问:597675次
    • 积分:8631
    • 等级:
    • 排名:第2640名
    • 原创:293篇
    • 转载:13篇
    • 译文:4篇
    • 评论:73条
    博客专栏
    微信订阅号
    欢迎加入QQ群
    玩家老黄历(微信小程序)
    谢谢支持~
    最新评论