番外篇:基于tesseract的光学字符训练

番外篇:基于tesseract的光学字符训练

前提环境

  1. Tesseract
  2. jTessBoxEditor
  3. java运行环境

附图为jTessBoxEditor执行目录所有的文件:
在这里插入图片描述

制造字体

制造字体需要明确需要检测的字体类型,例如需要检测的目标字体为宋体,那么就可以在输入文字的时候把字体的系列改成宋体,如下为笔者需要OCR识别的字体。
在这里插入图片描述

制造makebox文件

  1. 命令提示符下进入需要制作图片的路径。
  2. 输入以下命令。
> tesseract zh_CN6.song.exp0.tif zh_CN6.song.exp0 batch.nochop makebox.

在这里插入图片描述

纠正字体

  1. jTessBoxEditor 打开tif文件(makebox)。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值