tesseract验证码训练部骤

先简单记录下,以后再详细


1、使用jTessBoxEditor将验证码jpg文件merge tif合并成一个tif


2、生成box
tesseract eng.ver.exp0.tif eng.ver.exp0. -psm 7 -l eng batch.nochop makebox


3、使用jTessBoxEditor对box文件对比tif一个个字符校正


4、生成.tr训练文件
tesseract.exe eng.ver.exp0.tif eng.ver.exp0 -psm 7 nobatch box.train


3、新建文件font_properties,内容为ver 0 0 0 0 0 ,其中ver为上面的文件名第二个字段即字体名,需保存为无BOM的UTF8文件。
unicharset_extractor eng.ver.exp0.box


4、定义字体特征文件
mftraining.exe -F font_properties -U unicharset


5、完成训练
cntraining.exe eng.ver.exp0.tr
会产生5个文件:
inttemp
normproto
pffmtable
shapetable
unicharset


6、将以上文件改名,加上前缀selfverify.,注意有一点.,然后合并成为selfverify.traineddata文件
combine_tessdata.exe selfverify.


7、拷贝生成的selfverify.traineddata到tessdata目录


8、测试训练成果
tesseract test.jpg test -psm 7 -l selfverify


但本人测试却无法解析,不知道为何- -!待解决中。。。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值