1、安装Tesseract引擎
-
安装gcc、gcc-c++、make,如果有就不需要理会了
yum install gcc gcc-c++ make
-
安装编译相关工具,没有的话编译时候可能报错
yum install autoconf automake libtool
-
安装对图片识别相关支持工具
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
-
安装leptonica
前往官网下载压缩包后上传至linux后解压,下载链接:http://www.leptonica.org/download.html
#解压,注意这个leptionca的版本与tesseract的版本是否匹配 tar -zxvf leptonica-1.xx.x.tar.gz #进入文件夹 cd leptonica-1.xx.x # 依次执行以下命令,进行程序编译,安装 ./autogen.sh ./configure make make install
把leptonica添加到环境变量里头
# 修改profile vim /etc/profile # 添加信息 i export LD_LIBRARY_PATH=/usr/local/lib export LIBLEPT_HEADERSDIR=/usr/local/include export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig # 保存 Esc =》:wq! # 刷新配置 source /etc/profile
-
安装Tesseract-OCR
下载压缩包后上传至linux后解压,下载链接:https://github.com/tesseract-ocr/tesseract/releases
#解压 tar -xzvf tesseract-x.x.x.tar.gz cd tesseract-x.x.x ./autogen.sh ./configure make make install
添加到环境变量
vim /etc/profile # 添加以下字段: PATH=$PATH:/usr/local/tesseract/bin export PATH export TESSDATA_PREFIX=/root/tessdata #这个路径自己选择,tessdata要去下载 export PATH=$PATH:$TESSDATA_PREFIX # 刷新配置 source /etc/profile
-
下载tessdata语言包
下载链接:https://gitcode.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator
下载完自己去选个地方放,需要什么语言的下什么语言。
-
查看
# 查看tesseract版本 tesseract --version
如果出现下面的
说明安装成功。
2、使用Java测试的时候,报错
java.lang.NoClassDefFoundError: Could not initialize class net.sourceforge.tess4j.TessAPI
1、确定maven引入的tess4或这tess4j的版本是否与服务器上的版本一致。参考链接?http://tess4j.sf.net/docs/
2、有没有把so动态链接库确认复制好(关键),没有就去复制吧。ps:可能这些so链接并不是在/usr/local/lib里头,看你构建(make)Tesseract-OCR和leptonica是怎么丢在那的吧。
cp /usr/local/lib/*.so.* /usr/lib64/
3、最后,重启下服务器。
到这里,就可以用了。至于其他的问题。像什么没有linux-x86-64/libtesseract.so之类的。要么是Tesseract-OCR没装好,就是链接找不到的。