java实现OCR图文识别Tess4j,高准确率高效率java调用OCR文字识别技术，完整可运行

inovice

已于 2023-04-13 22:36:59 修改

阅读量8.9k

点赞数 10

文章标签： maven 图像处理人工智能

于 2022-05-14 16:23:24 首次发布

本文链接：https://blog.csdn.net/inovice/article/details/124769934

版权

java实现OCR图文识别Tess4j,高准确率高效率，用最新的词库2秒就可以识别，没有最新词库的找我

傻瓜式调用中文词库，及其方便。

虽然不能达到99%的准确率，但是也能达到90%左右的准确率，而且效率也非常高。总体来说相对于各大厂商的API接口来说，高昂的费用省下来不香吗。

本文以一张简单的图片为例：图片放置在E:/App/TestTess4/src/main/resources/bbb.png，因此使用代码测试前需要修改代码中指定的两个路径！！！

这篇文章是我从网络上随便找的，文字还是很优美哦

  /**
     * 图片文字识别
     */
    public void ocrDemo(){
        File imageFile = new File("E:/App/TestTess4/src/main/resources/bbb.png");
        Tesseract instance = new Tesseract();
        instance.setDatapath(DATA_PATH);
        instance.setVariable("user_defined_dpi", "300");
        instance.setLanguage(DEFAULT_LANG);

        try {
            long startTime = System.currentTimeMillis();
            String result = instance.doOCR(imageFile);
            System.out.println(result);

            long endTime = System.currentTimeMillis();
            long seconds = (endTime - startTime) / 1000;
            System.out.println("共用时："+ seconds + "秒");
        } catch(TesseractException e){
            e.printStackTrace();
        }
    }

一个简单的验证码识别就算完成了，怎么样是不是很简单。

：

https://download.csdn.net/download/inovice/85373037