PPOCR Label 导出识别结果不完整

问题:

使用PPOCRLabel自动标注后进行手动标注修改,或者是所有都进行手动标注,在导出结果后会发现,crop_img文件夹下不会保存相应截图,rec_gt.txt也不会保存相应信息,但是Label.txt文件保存信息完整。

思考过程:

既然Label.txt文件保存信息完整,我们可以观察Label.txt文件的保存信息。可以发现,如果是经手动修改的标注,在label中的"difficult"会保存为"true":

 观察PPOCRLabel.py文件可以发现,如果"difficult"保存为"true",crop_img文件夹和rec_gt.txt不会保存相应信息。

但是看遍源码也没找到为什么手动会将其设置为"true"(我太菜了),但还是找到了解决办法。

解决办法:

因为自动标注的结果能正常保存信息,而手动标注无法正常保存。(这时候我们就可以用魔法打败魔法,可能它的逻辑就是人为修改"difficult"就会显示"true",所以我们就可以用机器的方法识别。希望大佬们之后能够用代码解决问题)我们可以在标注后点击重新识别:

切记,手动标注框后不要按 ctrl + r 自动识别,标好所有框之后直接点击重新识别。对识别不对的文字或者数据进行人为修改。

点击重新识别之前标注结果需要显示未识别(理由后续会说明):

BUG:

如果使用 ctrl + r 自动识别或者重新识别多点了一次,如果界面弹出:

此时进行保存,会保存两组相同的识别框,识别结果可能不是我们之前手动修改的答案。

之所以要保证标注结果需要未识别,也是因为我们如果点击重新识别就不会出现unchanged,而是出现第一次的识别结果。之后再对错误的数据进行人为修改。

解决办法可以删除某个标注框再进行重新识别,这样保存就不会多保存数据了。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如果你想使用 ppocr识别 ROI 区域而不识别其他区域,可以尝试以下步骤: 1. 使用 Python 的 PIL 库读取原始图片文件,并截取 ROI 区域。 ``` python from PIL import Image # 读取原始图片 img = Image.open('path/to/image.png') # 截取 ROI 区域 roi = (x1, y1, x2, y2) # 假设 ROI 区域的左上角坐标为 (x1, y1),右下角坐标为 (x2, y2) roi_img = img.crop(roi) ``` 2. 将 ROI 区域保存为新的图片文件。 ``` python roi_img.save('path/to/roi_image.png') ``` 3. 使用 ppocr 识别新的图片文件。 ``` python import cv2 from ppocr.utils.utility import get_image_file_list from ppocr.service.recognition import RecognitionAPIService # 读取新的图片文件 img_path = 'path/to/roi_image.png' img = cv2.imread(img_path) # 使用 ppocr 识别图片 config = { 'Global': { 'debug': False, 'use_angle_cls': False, 'augmenter': False, 'rec_algorithm': 'CRNN', 'rec_model_dir': 'path/to/rec_model_dir', 'det_algorithm': 'DB', 'det_model_dir': 'path/to/det_model_dir', 'drop_score': 0.5, 'box_thresh': 0.5, 'image_shape': '3, 48, 192', 'max_text_length': 25, 'rec_batch_num': 30, 'rec_char_type': 'ch', 'rec_image_shape': '3, 32, 320', 'use_space_char': True, 'vis_font_path': 'path/to/font.ttf', }, 'DB': { 'det_db_thresh': 0.3, 'det_db_box_thresh': 0.5, 'det_db_unclip_ratio': 1.6, 'use_dilation': True, 'det_db_kernel_size': 3, 'max_candidates': 1000, 'polygon_type': 'poly', 'det_db_score_mode': 'fast', }, 'CRNN': { 'num_heads': 1, 'hidden_size': 256, 'rnn_layers': 2, 'dropout_prob': 0.1, 'num_classes': 6625, 'loss_type': 'ctc', 'label_smooth': False, 'label_smooth_beta': 0.1, }, } img_path_list = [img_path] service = RecognitionAPIService(config=config) result = service(img_path_list) # 输出识别结果 for item in result: print(item['data']) ``` 这样,你就可以使用 ppocr 识别 ROI 区域而不识别其他区域了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值