tesstrain

  • 为什么要使用tesstrain
      Tesseract固然很方便,便于使用,在开源OCR识别项目中属于翘楚。但是它也有局限,即tesseract4.0以后,图片样本都是自动生成的,根据开发者设置的字体,自动生成,然后加些噪声,干扰等,但是实际情况下,我们可能是有大量的文字图片,
需要把我们手头的图片做为数据集,这个时候有另一个开源项目tesstrain可以供我们使用。
  • tesstrain如何使用
      tesstrain github地址为 https://github.com/tesseract-ocr/tesstrain
      首先要保证tesseract是可以正常work的。tesstrain只是把tesseract之前生成数据这部分用自己的数据集替代了,后面的流程都一致。如果使用在官网上也给了说明,这里也不在赘述,这里重点说一些细节和容易被人忽视的地方。
  1. 注意官网上的内容也许和实际有些出入,还是要以代码为准,因为代码一直在更新,可能相应说明没有更新,举例说明
                  
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Neil_baby

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值