详细训练方法地址:http://blog.csdn.net/firehood_/article/details/8433077
1.将裁剪好的图片(jpg格式),运行jTessBoxEditor工具,在点击菜单栏中Tools--->Merge TIFF。在弹出的对话框中选择样本图像(按Shift选择多张)合并成num.font.exp0.tif文件
2.在文件中打开命令提示符cmd,执行命令:
tesseract.exe num.font.exp0.tif num.font.exp0 batch.nochop makebox
生成的BOX文件为num.font.exp0.box,BOX文件为Tessercat识别出的文字和其坐标。
3.运行jTessBoxEditor工具,open打开tif文件,矫正图片
4.bat文件运行得到traineddata
rem 执行改批处理前先要目录下创建font_properties文件
echo Run Tesseract for Training..
tesseract.exe num.font.exp0.tif num.font.exp0 nobatch box