java平台使用Tesseract

最新推荐文章于 2024-05-14 22:23:48 发布

林深人不知

最新推荐文章于 2024-05-14 22:23:48 发布

阅读量1.5k

点赞数 1

本文链接：https://blog.csdn.net/smallbabylong/article/details/130951382

版权

本文介绍了在Mac环境下，使用Java和Kotlin配合tess4j库进行tesseract-ocr图像识别的步骤。包括添加依赖、处理mac特定的libtesseract.dylib文件、设置数据路径以及训练工具的安装和使用。

摘要由CSDN通过智能技术生成

官方仓库

依赖包

net.sourceforge.tess4j:tess4j:5.7.0

使用Mac在Java平台操作

添加依赖
- 依赖包里已经包含了环境，可以使用在win平台，但是mac需要使用一个libtesseract.dylib文件，需要拷贝到项目里
安装tessdata
- 参考tessdoc配置环境

测试代码

使用kotlin进行测试

// tesseract  img.png out -l eng
fun main(args: Array<String>) {
   //指定图片路径
    val imageFile = File("resources/img.png");
    val instance = Tesseract(); // JNA Interface Mapping
    //使用jar包里的环境或者可以自己指定目录
    //val tessDataFolder = LoadLibs.extractTessResources("tessdata"); 
    //instance.setDatapath(tessDataFolder.getPath());
    instance.setLanguage("new")
    //自己指定路径
    val url = instance::class.java.classLoader.getResource("tessdata")
    instance.setDatapath(url.path)
    try {
        val result = instance.doOCR(imageFile);
        System.out.println("hnpu:" + result);
    } catch (e: TesseractException) {
        System.err.println(e.message)
    }
}