tesseract-ocr字符识别,安装/测试/训练 问题/解决方案

2018.5.4更新 training tesseract

由于Ubuntu下训练tesseract 教程不足,还在继续摸索。现在转用Windows下的tesseract 3.05版本(tesseract 4.0在我的win10下总是出错 还没办法解决)

  • windows tesseract版本下载
  • exe安装。
  • 安装完成后打开CMD输入tesseract回车出现tesseract介绍/help等,即安装成功。
测试:新建测试文件夹/.../test 用画图板准备图片文件:test.png


命令行进入该文件目录下,输入测试命令:

tesseract test.png output_test -l eng
【语法】tesseract imagename outputbase[-l lang] [-psm pagesegmode] [configfile...]
接下来的教程见→  教程

所遇到的问题及解决方案:

1. Failed to load font_properties from font_properties

【解决】: 将命令行

mftraining -F font_properties -U unicharset -O num.unicharset num.font.exp0.tr 

更改为:

mftraining -F font_properties.txt -U unicharset -O num.unicharset num.font.exp0.tr 
2.Illegal short name for a feature
换下一张图片进行训练,(跳过该问题训练集)

3.ICU ERROR...


【解决】打开VS调试,选择调试→选项→调试→常规→启动源服务器支持
                                                                                →符号→Microsoft符号服务器
有图教程

4.【画了6张tif图,但是无法用jTessBoxEdit合并,可能训练样本有问题,重新尝试解决】

5. empty page
6. jTessBoxEditor中文乱码 在setting中将字体改为宋体 


  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值