解决tessercat生成tr文件时报错问题。已经解决

解决tessercat生成tr文件时报错问题。已经解决。

问题背景

目前在做自动化的时候需要自动识别图像验证码,于是采用了python+pytessercat,使用tessercat-OCR去识别(具体使用步骤请移步到其他博客中查看如何使用)然而在训练字库时,调整完字体,生成tr文件时,报错内容为:
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb8d68 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatapunc-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb7dc0 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddataword-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb7d28 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatanumber-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb8468 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatafreq-dawg)
看到网上解决这个问题的资料较少,于是将我应用的方法发出来供大家参考。

问题原因

在网上搜索相关错误时,偶然看到有人发是box文件生产时有部分图片没有识别到且在调整字符时也没有显示出红框,如图:
在这里插入图片描述
这种情况无法在jTessBoxEditorFX内部调整。到生成tr文件步骤时就会报错。

解决方法

1、使用记事本打开训练图片生成的box文件
在这里插入图片描述
在这里插入图片描述
文件内容最后一列为图片的顺序,可以在第一帐图片中看到我们是第二张图片没有被识别出来,看文件内容也没有第二张图片的内容,将其他图片的内容复制为第二张图片,如复制第一张图片内容,然后将文本最后一列改为图片顺序,这里我改为2

在这里插入图片描述
*修改文本内容为为识别图片
*
在这里插入图片描述保存文本文档,使用jtessboxeditorfx打开修改的box文档
在这里插入图片描述
可以看到第二张图片上有了识别内容,在调整字符值与位置,保存后可以正常生成tr文件。
本人实测,已经解决

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值