java tessdata训练_Tesseract For Java为可执行jar设置Tessdata_Prefix

该项目的最终目标是获取jar并将其放在使用tesseract的目录中,并输出结果目录和输出txt文件.不过,我在使用tesseract时遇到了一些问题.

我正在使用

Java中的tess4j与Maven合作,我想将我的代码变成可执行jar.该项目作为桌面应用程序工作正常,但每当我尝试使用java -jar fileName.jar运行(导出到jar后)它给我错误

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory

Failed loading language 'eng'

...

我在网上查看并且无法真正找到如何为jar设置tesseract并使路径正确.现在我使用maven并在我的pom文件(tess4j -v 3.0)中使用Tesseract依赖项,我的项目中有tessdata.

我对maven和jar文件相当新,之前从未使用过tesseract,但据我所知,从互联网上我正确设置了它.

有谁知道如何使tess4j指向我的项目中的tessdata目录,并有一个动态路径,所以我可以移动在多台计算机和地方使用它?

这就是我称之为Tesseract的方式

Tesseract instance = new Tesseract();

instance.setDatapath("src/main/resources");

String result = instance.doOCR(imageFile);

String fileName = imageFile.getName().replace(".jpg", "");

System.out.println("Parsed Image " + fileName);

return result;

编辑

这就是我尝试在我的代码中设置环境变量TESSDATA_PREFIX的方法

String dir = System.getProperty("user.dir");

System.out.println("current dir = " + dir);

ProcessBuilder pb = new ProcessBuilder("CMD", "/C", "SET");

Map env = pb.environment();

env.put("TESSDATA_PREFIX", dir + "\\tessdata");

Process p = pb.start();

但这没有明显的效果.我仍然有同样的错误

编辑2

根据错误消息,我需要将它设置为tessdata的父目录,我也试过这个无济于事

编辑3

经过大量的搜索并尝试修复它,我不确定它是否可能. tesseract中的doOcr方法接受缓冲图像或文件,如果我的图像不是动态的,那就没关系,所以我不能将它们真正存储在jar中.更不用说TESSDATA_PREFIX仍然不会设置的事实.如果有人有任何想法,我仍然耳朵,我会继续寻找解决方案,但我不确定它会起作用

最佳答案 您可以调用instance.setDatapath方法将Tesseract指向tessdata文件夹的位置.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值