java中Tesseract-OCR的使用与中文识别增强，减少识别错误率

最新推荐文章于 2025-03-03 20:53:02 发布

MeSloop

最新推荐文章于 2025-03-03 20:53:02 发布

阅读量6.7k

点赞数 2

分类专栏： java tesseract 文章标签： tesseract java ocr

本文链接：https://blog.csdn.net/intenttao/article/details/84578571

版权

java 同时被 2 个专栏收录

5 篇文章

订阅专栏

tesseract

1 篇文章

订阅专栏

这是一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎，与Microsoft Office Document Imaging（MODI）相比，我们可以不断的训练的库，使图像转换文本的能力不断增强；如果团队深度需要，还可以以它为模板，开发出符合自身需求的OCR引擎。

git地址为：https://github.com/tesseract-ocr/tesseract；

首先创建一个java项目并集成 tesseract引擎库

集成方式：

1.jar包导入需要导入以下jar包，集成方式比较繁琐

2.maven库依赖导入在maven项目中的pom文件中加入以下依赖

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.1.1</version>
    <exclusions>
        <exclusion>
            <groupId>com.sun.jna</groupId>
            <artifactId>jna</artifactId>
        </exclusion>
    </exclusions>
</dependency>

java识别代码

   private static String ocr(String filePath) {
        String result = null;
        try {
            double start = System.currentTimeMillis();
            BufferedImage textImage = ImageIO.read(new File(filePath));
            // 这里对图片黑白处理,增强识别率.这里先通过截图,截取图片中需要识别的部分
            textImage = ImageHelper.convertImageToGrayscale(textImage);
            // 图片锐化
            textImage = ImageHelper.convertImageToBinary(textImage);
            // 图片放大倍数,增强识别率(很多图片本身无法识别,放大5倍时就可以轻易识,但是考滤到客户电脑配置低,针式打印机打印不连贯的问题,这里就放大5倍)
            textImage = ImageHelper.getScaledInstance(textImage, textImage.getWidth() * 1, textImage.getHeight() * 1);

            textImage = ImageHelper.convertImageToBinary(textImage);
            ImageIO.write(textImage, "png", new File("E:\\accccccccccccc\\img_temp.jpg"));

            Tesseract instance = new Tesseract();
            instance.setDatapath(System.getProperty("user.dir") + "\\tessdata");//设置训练库的位置
            instance.setLanguage("chi_simmm");//中文识别
            instance.setLanguage("chi_simm");//中文识别
            instance.setLanguage("chi_sim");//中文识别
//            instance.setLanguage("chi_tra");//中文识别
//            instance.setLanguage("eng");//英文识别
            result = instance.doOCR(textImage);
            double end = System.currentTimeMillis();
            System.out.println("耗时" + (end - start) / 1000 + " s");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return result;
    }

识别的图片为：