使用到的pom包
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.1.1</version>
<exclusions>
<exclusion>
<groupId>com.sun.jna</groupId>
<artifactId>jna</artifactId>
</exclusion>
</exclusions>
</dependency>
我这块使用的是识别图片的文本信息,我这块使用的是BufferedImage 格式,想用其他格式可以查看Tesseract类来使用
private static final String TESSDATA_PATH = "/usr/local/share/tessdata";
/**
* 图片解析
* */
public static String getCode(BufferedImage codeImage ) throws Exception {
Tesseract tessreact = new Tesseract();
tessreact.setDatapath(TESSDATA_PATH);
String result = tessreact.doOCR(codeImage);
return result.replace(" ", "").trim();
}
linux环境搭建可查看其他文章linux使用tesseract环境搭建
语言包下载地址我这块使用的是eng.traineddata 下载完成后放到tessdata目录下就可以了
windwos直接下载修改TESSDATA_PATH 指向到tessdata目录下就可以我这块没遇到其他问题