PPOCR Label 导出识别结果不完整

最新推荐文章于 2024-07-07 19:45:00 发布

续航能力

最新推荐文章于 2024-07-07 19:45:00 发布

阅读量400

点赞数 2

文章标签： pycharm paddlepaddle python ocr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Byhxh/article/details/134970837

版权

问题：

使用PPOCRLabel自动标注后进行手动标注修改，或者是所有都进行手动标注，在导出结果后会发现，crop_img文件夹下不会保存相应截图，rec_gt.txt也不会保存相应信息，但是Label.txt文件保存信息完整。

思考过程：

既然Label.txt文件保存信息完整，我们可以观察Label.txt文件的保存信息。可以发现，如果是经手动修改的标注，在label中的"difficult"会保存为"true":

观察PPOCRLabel.py文件可以发现，如果"difficult"保存为"true"，crop_img文件夹和rec_gt.txt不会保存相应信息。

但是看遍源码也没找到为什么手动会将其设置为"true"（我太菜了），但还是找到了解决办法。

解决办法：

因为自动标注的结果能正常保存信息，而手动标注无法正常保存。（这时候我们就可以用魔法打败魔法，可能它的逻辑就是人为修改"difficult"就会显示"true"，所以我们就可以用机器的方法识别。希望大佬们之后能够用代码解决问题）我们可以在标注后点击重新识别：

切记，手动标注框后不要按 ctrl + r 自动识别，标好所有框之后直接点击重新识别。对识别不对的文字或者数据进行人为修改。

点击重新识别之前标注结果需要显示未识别（理由后续会说明）：

BUG：

如果使用 ctrl + r 自动识别或者重新识别多点了一次，如果界面弹出：

此时进行保存，会保存两组相同的识别框，识别结果可能不是我们之前手动修改的答案。

之所以要保证标注结果需要未识别，也是因为我们如果点击重新识别就不会出现unchanged，而是出现第一次的识别结果。之后再对错误的数据进行人为修改。

解决办法可以删除某个标注框再进行重新识别，这样保存就不会多保存数据了。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PPOCR Label 导出识别结果不完整

（这时候我们就可以用魔法打败魔法，可能它的逻辑就是人为修改"difficult"就会显示"true"，所以我们就可以用机器的方法识别。使用PPOCRLabel自动标注后进行手动标注修改，或者是所有都进行手动标注，在导出结果后会发现，此时进行保存，会保存两组相同的识别框，识别结果可能不是我们之前手动修改的答案。之所以要保证标注结果需要未识别，也是因为我们如果点击重新识别就不会出现。可以发现，如果是经手动修改的标注，在label中的。可以删除某个标注框再进行重新识别，这样保存就不会多保存数据了。
复制链接

扫一扫

续航能力 CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

167万+: 周排名

30万+: 总排名

400: 访问

: 等级

15: 积分

1: 粉丝

2: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

PPOCR Label 导出识别结果不完整 400

最新评论

PPOCR Label 导出识别结果不完整
CSDN-Ada助手: 恭喜你开始了博客创作的旅程！标题“PPOCR Label 导出识别结果不完整”让我很感兴趣，期待能够看到你对这个问题的深入分析。在你的博客中，你可以尝试将你遇到的问题具体描述，并尽量提供一些例子或者截图来支持你的观点。此外，你还可以尝试探索一些解决方案，或者分享一些你自己的经验和技巧。期待看到你的下一篇文章！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。