环境:编译器是IDEA,操作系统Win7
第一步:下载Tess4J
下载地址:点击打开链接
下载后解压,解压后的目录结构如下
第二步:引入jar包
将上图目录里dist里面的“tess4j-3.4.8.jar”和lib下的所有jar引入你自己的工程,我是IDEA下的web工程,所以就放在的下图所示的位置
第三步:指定tessdata文件
tessdata文件是存放的字体库,需要将文件加放到项目根目录(我试过不可以),否则要在代码中指定目录,在代码中这样写
ITesseract instance = new Tesseract();
instance.setDatapath("D:\\Tess4J-3.4.8-src\\Tess4J");//当tessdata的目录是
D:\\Tess4J-3.4.8-src\\Tess4J\\tessdata时
instance.setLanguage("eng");//选择字库文件(只需要文件名,不需要后缀名)
第四步:写测试代码
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import java.io.File;
/**
* Created by Administrator on 2018-05-25.
*/
public class Demo {
public static void main(String[] args){
try {
File imageFile = new File("E:\\test\\test.png");//图片位置
ITesseract instance = new Tesseract();
instance.setDatapath("D:\\Tess4J-3.4.8-src\\Tess4J");
instance.setLanguage("eng");//选择字库文件(只需要文件名,不需要后缀名)
String result = instance.doOCR(imageFile);//开始识别
System.out.println(result);//打印图片内容
} catch (TesseractException e) {
e.printStackTrace();
}
}
}
注意:
1、上述代码图片位置要换成自己的
2、网上很多说要因dll库的,最新版已经不需要了,tess4j.jar 内有所需dll库
代码下载:点击打开链接