CentOS 6.3 下build tesseract

参考:https://code.google.com/p/tesseract-ocr/wiki/Compiling


安装Dependencies:

yes | yum install libpng-devel.x86_64

yes | yum install libjpeg-devel.x86_64

yes | yum install libtiff-devel.x86_64

yes | yum install zlib-devel.x86_64


安装Leptonica:

Leptonica官网的svn checkout 方法貌似不行,执行 svn checkout http://leptonica.googlecode.com/svn/trunk/ /your/own/directory 的结果是,除了一个trunk子目录,啥也没有。

退而求其次,下载源代码打包。解压后,进入Leptonica源代码目录。
./configure #注意:没做configure之前是没有Makefile文件的,之后才生成的
make
make install #默认安装到了/usr/local/lib 下面,是一些静态库和动态库文件;头文件默认位于/usr/local/include/leptonica


安装Tesseract:

用svn checkout http://tesseract-ocr.googlecode.com/svn/trunk/ /your/own/directory 把源代码checkout到本地。进入目录,然后
./autogen.sh #用来生成configure文件
./configure
make
make install #默认安装到 /usr/local/include、 /usr/local/lib 和 /usr/local/bin/ 下面
ldconfig #这步操作别忘了!


设置Tesseract环境变量:

下载tesseract-ocr-3.02.eng.tar.gz, tesseract-ocr-3.02.chi_sim.tar.gz, tesseract-ocr-3.02.chi_tra.tar.gz 等语言数据文件,解压后,会解压到一个共同的子目录tessedata中。

然后设置环境变量TESSDATA_PREFIX为tessedata目录的上一级目录。如果不配环境变量TESSDATA_PREFIX,会遇到下面的错误:

Error opening data file /home/yasi/tessdata/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.


运行Tesseract:

准备带有文字的图片文件,如./pic.png,然后 tesseract ./pic.png textfile


equationdetect.cpp编译问题:

如果遇到下面的编译问题,很可能是equationdetect.cpp文件的编码格式有问题。检查它的编码格式,如果是Unicode的,改成UTF-8,重新编译。



  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值