实践记录
记录项目、科研过程中的点滴
ayayayayo
这个作者很懒,什么都没留下…
展开
-
【OCR】win10环境下Tesseract-OCR 4.0LSTM训练流程
下载mnist数据集,并处理数据到tif和box格式。其中每一个tif和box文件都保存了10个数字,对于60000数据样本,总共生成6000张图片。tif+box文件数目共12000。jTessBoxEditor合并待训练图片,生成并调整.box文件使用jTessBoxEditor工具,选择Tools–Merge TIFF,选择第一步中生成的所有tif文件,并设置合并后的TIFF文件名为nml.num.exp0,nml是语言名,num是字体名,exp0是版本号。训练过程应保持这种命名习惯。..原创 2020-08-09 11:29:12 · 2191 阅读 · 2 评论 -
【OCR】tesseract与jTessBoxEditor的安装
参考:https://blog.csdn.net/jiuzhongxian_/article/details/105239684?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-3&spm=1001.2101.3001.4242原创 2020-08-05 11:37:58 · 295 阅读 · 0 评论