Windows下Tesseract 字库半自动训练

首先得感谢大神的博客:https://blog.csdn.net/dcrmg/article/details/78233459?locationNum=7&fps=1

前期安装和最后字库测试请参照上面博客,本人只是做了一些偷懒的操作.

请参照大神步骤走到3.4操作,然后复制以下脚本保存为"tesseract_auto.sh",放到你的字库文件根目录下,点击运行

echo font 0 0 0 0 0>font_properties
tesseract chi_my.font.exp0.tif chi_my.font.exp0 nobatch box.train
unicharset_extractor chi_my.font.exp0.box
mftraining -F font_properties -U unicharset -O chi_my.unicharset chi_my.font.exp0.tr
cntraining chi_my.font.exp0.tr
mv inttemp chi_my.inttemp
mv pffmtable chi_my.pffmtable
mv normproto chi_my.normproto
mv shapetable chi_my.shapetable
combine_tessdata chi_my.
rm chi_my.font.exp0.tr
rm chi_my.inttemp
rm chi_my.normproto
rm chi_my.pffmtable
rm chi_my.shapetable
rm unicharset
rm chi_my.unicharset
rm font_properties

对照着看会发现,基本上只是多了一些偷懒操作,还清了一些缓存
阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

Windows下Tesseract 字库半自动训练

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭