tess4j 识别图片文字

本文介绍了如何在Java中使用Tesseract库对图像进行中文识别,设置了训练库路径和语言环境,允许用户输入文件路径并提取特定区域的文本。
摘要由CSDN通过智能技术生成

首先需要下载训练库
文中setDatapath的路径要设置训练库所在位置路径
训练库文件网址

package TestOCR;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import java.awt.*;
import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Scanner;

import static org.apache.pdfbox.cos.COSName.AA;

public class TestTess4j {

    public static void main(String[] args) throws IOException {
        ITesseract in = new Tesseract();
        in.setDatapath("G:\\lan\\1");//设置训练库本地位置   默认位置./当前目录
        in.setLanguage("chi_sim");//设置语言 默认是eng英文
        boolean f = true;
        Scanner scanner = new Scanner(System.in);

        while(f) {
            System.out.println("请输入" + ":exit 或者  文件路径");
            String line = scanner.nextLine();
            line= line.replace("\\","\\\\");
            switch (line){
            case "exit":
                System.exit(0);
                break;
                default:
                    try {
                       Rectangle r1 = new Rectangle(0,0,704,40);
                        Rectangle r2 = new Rectangle(0,41,704,30);
                        Rectangle r3 = new Rectangle(0,70,704,29);
                        List<Rectangle> list = new ArrayList<>();
                        list.add(r1);
                        list.add(r2);
                        list.add(r3);
                        for (Rectangle r: list
                             ) {
                            String result = in.doOCR(new File(line),r);
                            System.out.println(line+"==resule===========:" + result);
                        }

                    } catch (TesseractException e) {
                        e.printStackTrace();
                    };break;
        }

        }
    }
}

测试图片
在这里插入图片描述
运行结果图
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值