集成环境:win10,jTessBoxEditor-1.7.3
1.需要生成字符集的.tif和.box这俩个文件。
假设:需要合并三个字典liu.宋体.exp0,liu1.微软雅黑light.exp0,micrsoft.microsoftyaheiuilight.exp0(注:个人生成的字典有个人的名字,建议用自己的名字)
(1)将这三个字典的.tif和.box文件拷贝到一个文件夹下;
2.生成相对应的tr文件:
(1)生成liu.宋体.exp0的tr文件
命令:tesseract liu.宋体.exp0.tif liu.宋体.exp0 nobatch box.train(DOS下运行)
(2)生成