解决tessercat生成tr文件时报错问题。已经解决

最新推荐文章于 2024-04-19 14:13:29 发布

天天打底裤

最新推荐文章于 2024-04-19 14:13:29 发布

阅读量1.1k

点赞数 2

分类专栏：自动化测试学习之路文章标签： python ocr 图像识别

本文链接：https://blog.csdn.net/weixin_46659230/article/details/115085984

版权

自动化测试学习之路专栏收录该内容

3 篇文章 1 订阅

订阅专栏

解决tessercat生成tr文件时报错问题。已经解决。

问题背景

目前在做自动化的时候需要自动识别图像验证码，于是采用了python+pytessercat，使用tessercat-OCR去识别（具体使用步骤请移步到其他博客中查看如何使用）然而在训练字库时，调整完字体，生成tr文件时，报错内容为：
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb8d68 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatapunc-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb7dc0 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddataword-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb7d28 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatanumber-dawg)
ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb8468 still has count 1 (id /sdcard/tesseract/tessdata/eng.traineddatafreq-dawg)
看到网上解决这个问题的资料较少，于是将我应用的方法发出来供大家参考。

问题原因

在网上搜索相关错误时，偶然看到有人发是box文件生产时有部分图片没有识别到且在调整字符时也没有显示出红框，如图：
在这里插入图片描述
这种情况无法在jTessBoxEditorFX内部调整。到生成tr文件步骤时就会报错。

解决方法

1、使用记事本打开训练图片生成的box文件
在这里插入图片描述

文件内容最后一列为图片的顺序，可以在第一帐图片中看到我们是第二张图片没有被识别出来，看文件内容也没有第二张图片的内容，将其他图片的内容复制为第二张图片，如复制第一张图片内容，然后将文本最后一列改为图片顺序，这里我改为2。

在这里插入图片描述
*修改文本内容为为识别图片
*
保存文本文档，使用jtessboxeditorfx打开修改的box文档

可以看到第二张图片上有了识别内容，在调整字符值与位置，保存后可以正常生成tr文件。
本人实测，已经解决

天天打底裤

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
解决tessercat生成tr文件时报错问题。已经解决

解决tessercat生成tr文件时报错问题。已经解决。问题背景目前在做自动化的时候需要自动识别图像验证码，于是采用了python+pytessercat，使用tessercat-OCR去识别（具体使用步骤请移步到其他博客中查看如何使用）然而在训练字库时，调整完字体，生成tr文件时，报错内容为：ObjectCache(0x6761eba4)::~ObjectCache(): WARNING! LEAK! object 0x67fb8d68 still has count 1 (id /sdcard/t
复制链接

扫一扫