tess4j linux so文件,linux tesseract 安装及部署tess4j项目的常见问题

504 次查看

linux上部署tess4j项目

在windows上项目是可以正常运行的,部署到Linux上后,运行报异常,异常内容为:Unable to load library ‘tesseract’: Native library (linux-x86-64/libtesseract)

这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件,windows是.dll文件)

解决:

在资源文件win32-x86那一层添加linux-x86-64/所需的so文件

98918bb5849bcf9c47ebb72515252405.png

1.将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下,问题解决,nice

2.可能是eng语言包有问题,正确的包文件如下:

794b09d668b20f76dd7658b08a7a1ff4.png

记录一下在Linux上部署tesseract

( 所需要的  Linux 安装包 tesseract-ocr-3.02.02.tar.gz及安装需要的leptonica-1.68.tar.gz  英文语言包 tesseract-ocr-3.02.eng.tar.gz 戳链接:戳我)

1,编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)

yum install gcc gcc-c++ make

2,autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:

[php]

(1)yum install autoconf automake libtool

(2)yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

[/php]

3,安装 leptonica

下载 leptonica-1.68.tar.gz

tar-zxvf leptonica-1.68.tar.gz

(1) 进入 leptonica-1.73文件夹内(cd 命令)

(2) 执行下面command

[php]

./configure

make

make install

ldconfig

[/php]

4,安装 tesseract

下载 tesseract-ocr-3.02.02.tar.gz

(1) 进入 tesseract-ocr-3.02.02文件夹内(cd 命令)

(2) 执行下面command

[php]

./autogen.sh

./configure

make

make install

ldconfig

[/php]

如果需要在linux上运行带tess4j的项目,需要将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下

5,安装语言包

下载 tesseract-ocr-3.02.eng.tar.gz (如果需要验证中文,就下载中文的语言包)

tar -zxvf tesseract-ocr-3.02.eng.tar.gz

解压后将 tesseract-ocr/tessdata 下的所有文件全部拷贝到 /usr/local/share/tessdata 下。 ,如果没有tessdata文件夹,就去tesseract的安装文件位置将目录下的tessdata拷贝到  /usr/local/share/

6,执行命令 [php]tesseract[/php]

如果出现下图,就安装成功了

c8a3e4f660b59268e182d9bf34177112.png

7,到这,你就可以敲下面的代码验证图片中的文字了:

[xml]

命令: tesseract 图片名  输出文本名 -l eng

[/xml]

126f3413873f280c231fc429ae6260d9.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要确保Tess4J库和Tesseract OCR引擎的JNI库已正确添加到您的项目中,可以按照以下步骤进行检查: 1. 确认您已正确配置Tess4J库的依赖项。这通常涉及到将Tess4J的JAR文件添加到您的项目的构建路径中。可以使用构建工具(如Maven或Gradle)或手动添加JAR文件项目lib目录中。 2. 检查JNI库的存在。Tess4J依赖于Tesseract OCR引擎的JNI库,这些库通常是与操作系统和架构相关的共享库文件。您需要确保这些库文件存在于您的项目中,并且能够在运行时正确加载。 - 首先,确认您已正确安装Tesseract OCR引擎。您可以从Tesseract的官方网站(https://github.com/tesseract-ocr/tesseract)下载适用于您的操作系统的最新版本,并按照官方文档进行安装。 - 接下来,检查您的项目中是否包含了与操作系统和架构相匹配的JNI库文件。这些库文件通常是以`.dll`(Windows)、`.so`(Linux)或`.dylib`(macOS)为后缀的文件。确保这些文件存在于项目的正确位置,并且能够在运行时被访问到。 3. 检查运行时环境的配置。如果您的项目在特定的运行时环境中运行,例如Tomcat或其他应用服务器,确保您已正确配置了该环境,以便能够加载Tess4J和相关的JNI库。这可能涉及到设置环境变量、配置文件路径或其他相关配置。 4. 运行项目并检查日志。在项目运行时,观察控制台输出或日志文件中是否有与Tess4J或Tesseract OCR引擎相关的错误或警告信息。这些信息可能会提供更多关于缺失或加载失败的JNI库的线索。 通过以上步骤的检查,您应该能够确定是否已正确添加了Tess4J库和Tesseract OCR引擎相关的JNI库到您的项目中。如果问题仍然存在,请提供更多的上下文信息,以便我们能够更好地帮助您解决问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值