1、
首先,下载Tess4J的相关资源(一个压缩包),官网:http://tess4j.sourceforge.net/codesample.html。
2、
相应的lib和dist下的jar导入项目。环境变量TESSDATA_PREFIX配置。
3、
这是一个大坑,最重要的下载插件 Visual C++ 2015 :
https://www.microsoft.com/en-us/download/details.aspx?id=53587
4、
导入识别相关语言的数据,数据下载地址:https://github.com/tesseract-ocr/tessdata
最后执行代码:
public static void main(String[] args) throws TesseractException {
File file = new File("C:\\java\\img\\test2.png");
ITesseract instance = new Tesseract();
instance.setDatapath("C:\\java\\OCR\\tess4J\\Tess4J\\tessdata");//设置你的Tess4J下的tessdata目录
instance.setLanguage("chi_sim");//指定需要识别的语种
String result = instance.doOCR(file);
System.out.println(result);
}
结果: