1.前置工作
1.环境:win7x64
2.安装了Tesseract-OCR工具:版本 3.02.02
3.安装了jTessBoxEditorFX训练工具
2.需要的资料
1.TIFF(重要)与 jpg 的训练图片素材;
3.训练过程
1. 使用tessract 命令,生成box文件(tif与jpg文件需要同名且在同一文件夹下)
命名规则: [自定义的语言名称(可以任意)].[字体名字(需要与font_properties内的一致)].[exp[n]].[文件后缀]
2. 以管理员身份运行cmd命令行,进入到该目录下,执行命令,该命令会生成一个box文件l;
格式:
tesseract [文件名] -l [解析使用的语言] batch.nochop makebox
如:
tesseract xsz.xingshi