问题:
使用PPOCRLabel自动标注后进行手动标注修改,或者是所有都进行手动标注,在导出结果后会发现,crop_img文件夹下不会保存相应截图,rec_gt.txt也不会保存相应信息,但是Label.txt文件保存信息完整。
思考过程:
既然Label.txt文件保存信息完整,我们可以观察Label.txt文件的保存信息。可以发现,如果是经手动修改的标注,在label中的"difficult"会保存为"true":
观察PPOCRLabel.py文件可以发现,如果"difficult"保存为"true",crop_img文件夹和rec_gt.txt不会保存相应信息。
但是看遍源码也没找到为什么手动会将其设置为"true"(我太菜了),但还是找到了解决办法。
解决办法:
因为自动标注的结果能正常保存信息,而手动标注无法正常保存。(这时候我们就可以用魔法打败魔法,可能它的逻辑就是人为修改"difficult"就会显示"true",所以我们就可以用机器的方法识别。希望大佬们之后能够用代码解决问题)我们可以在标注后点击重新识别:
切记,手动标注框后不要按 ctrl + r 自动识别,标好所有框之后直接点击重新识别。对识别不对的文字或者数据进行人为修改。
点击重新识别之前标注结果需要显示未识别(理由后续会说明):
BUG:
如果使用 ctrl + r 自动识别或者重新识别多点了一次,如果界面弹出:
此时进行保存,会保存两组相同的识别框,识别结果可能不是我们之前手动修改的答案。
之所以要保证标注结果需要未识别,也是因为我们如果点击重新识别就不会出现unchanged,而是出现第一次的识别结果。之后再对错误的数据进行人为修改。
解决办法可以删除某个标注框再进行重新识别,这样保存就不会多保存数据了。