首先得感谢大神的博客:https://blog.csdn.net/dcrmg/article/details/78233459?locationNum=7&fps=1
前期安装和最后字库测试请参照上面博客,本人只是做了一些偷懒的操作.
请参照大神步骤走到3.4操作,然后复制以下脚本保存为"tesseract_auto.sh",放到你的字库文件根目录下,点击运行
echo font 0 0 0 0 0>font_properties
tesseract chi_my.font.exp0.tif chi_my.font.exp0 nobatch box.train
unicharset_extractor chi_my.font.exp0.box
mftraining -F font_properties -U unicharset -O chi_my.unicharset chi_my.font.exp0.tr
cntraining chi_my.font.exp0.tr
mv inttemp chi_my.inttemp
mv pffmtable chi_my.pffmtable
mv normproto chi_my.normproto
mv shapetable chi_my.shapetable
combine_tessdata chi_my.
rm chi_my.font.exp0.tr
rm chi_my.inttemp
rm chi_my.normproto
rm chi_my.pffmtable
rm chi_my.shapetable
rm unicharset
rm chi_my.unicharset
rm font_properties
对照着看会发现,基本上只是多了一些偷懒操作,还清了一些缓存