下载jTessBoxEditor3.2
http://vietocr.sourceforge.net/training.html
下载解压就能用了。
安装jre依赖
使用jTessBoxEditor进行自定义训练
相关参数说明
这里自己制作训练图片,自己做标注
依靠两个文件生成可用*.traineddata数据。
使用生成的*.traineddata
将其复制到tesseract-OCR的tessdata目录下
在代码中使用
text=pytesseract.image_to_string(img,lang='num')