使用场景:
提示:这里简述项目使用背景:
在内网封闭环境,只能离线安装,而且tesseract离线包,./autogen.sh命令无法使用,故本次使用最小化安装。
只需要安装leptonica-1.79.0.tar.gz,及所需的so文件,和libstdc++.so.6.0.26文件。
网上大多是付费和不能用的,这里给大家提供一个免费可用的版本。
安装步骤
1.引⼊pom⽂件
<!-- Tess4J是对Tesseract OCR API.的Java JNA 封装。使java能够通过调⽤Tess4J的API来使⽤Tess eract OCR。⽀持的格式:TIFF,JPEG,GIF,PNG,BMP,JPEG,and PDF -->
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.5.1</version>
</dependency>
2.Linux安装对应的leptonica环境
2.1提前下载好⽂件
leptonica-1.79.0.tar.gz
下载好后放在⾃⼰定义好的服务器⽂件夹中。这⾥我们放到 /usr/local/ 下。
2.2安装
linux下执⾏命令
cd /usr/local
mkdir /usr/local/leptonica tar -xzvf leptonica-1.79.0.tar.gz
cd leptonica-1.79.0
./configure --prefix=/usr/local/leptonica && make && make install
配置leptonica环境变量
执⾏命令
vim /etc/profile
在⽂件末尾追加配置
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib export
LD_LIBRARY_PATH LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica export
LIBLEPT_HEADERSDIR
再输⼊⽣效配置命令
source /etc/profile
3.Springboot项⽬配置
完成了上⾯的环境基础后,我们回到项⽬⾥来,直接安装有三个⽂件
libtesseract.so
libtesseract.so.4
libtesseract.so.4.0.1
放到项⽬resources中再打包成jar包
项目在linux上可正常调用。
可能出现问题
libstdc++.so.6: version `GLIBCXX_3.4.20’ not found的错误
内网linux没有libstdc++.so.6.0.26文件
可以通过网盘分享文件直接替换内网文件
将文件libstdc++.so.6.0.26,移动至/usr/lib64
执行命令
ln -sf /usr/lib64/libstdc++.so.6.0.26 /usr/lib64/libstdc++.so.6