mac上Tesseract3.04.01_2样本训练

安装tesseract

brew uninstall tesseract
brew install --with-training-tools tesseract

构建字符集

  • 合并为tif
    tools-Merge Tiff

保存为num.myfont.exp0.tif

  • 生成box

tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 batch.nochop makebox
  • 使用jTessBoxEditor修改box文件

  • 生产font_properties

echo myfont 0 0 0 0 0 >font_properties
  • 生成训练文件

tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 nobatch box.train
  • 生成字符集文件

unicharset_extractor num.myfont.exp0.box
  • 生成shape

shapeclustering -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
  • 聚合字符特征文件

mftraining -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
  • 正常化

cntraining num.myfont.exp0.tr
  • 合并训练文件

cp normproto myfont.normproto
cp inttemp myfont.inttemp
cp pffmtable myfont.pffmtable
cp unicharset myfont.unicharset
cp shapetable myfont.shapetable
combine_tessdata myfont.

新增语言

brew list tesseract

查看tessdata位置

cp myfont.traineddata /usr/local/Cellar/tesseract/3.04.01_2/share/tessdata/
tesseract --list-langs

测试

tesseract 9606.tif output -l myfont -psm 7

doc

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值