1、Java项目中引入tess4j库,用gradle配置如下:
implementation 'net.sourceforge.tess4j:tess4j:5.2.0'
2、安装Tesseract5.0
因Tess4j无法在mac系统使用,报错找不到一些依赖的类库,所以必须安装tesseract5.0.
安装可以用:
brew install tesseract
如果要用图片训练tesstrain,则需要从github下源代码编译(GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)),本人这里需要用训练,所以是下载代码编译的,过程比较复杂,可以直接它的安装文档进行安装。
3、设置java运行变量tessdata的位置,如下。
4、以上步骤完成,运行j