github字库地址:https://github.com/tesseract-ocr/tessdata
一、tesseract-ocr字库训练
1、配置 jdk 环境变量
步骤(略)
2、安装 tesseract-ocr 并配置环境变量
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
配置环境变量:系统变量path添加 C:\Program Files (x86)\Tesseract-OCR; D:\Tesseract-OCR(对应自己的tesseract安装目录)
3、下载jTessBoxEditor2.0工具
下载地址:https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/
下载完成后,解压缩并双击 jTessBoxEditor.jar 即可启动
4、下载Tess4J-3.4.8
解压即可得到 tessd