Python批量检查labelimg数字标签是否标注错误

在大规模标注数字图像数据集时,可能存在错误。本文介绍如何利用Python检查labelimg标注的数字标签,通过比较文件名后缀与xml文件中的标签,找出错误并修复,以确保数据准确性。
摘要由CSDN通过智能技术生成

在我们标注一个几千张的数据集的时候,难免会出错。而这些错误会被当成负样本,对我们的准确度造成影响。

以我为例,做仪表识别时,标注数千张数字图片。

大概是这样的。
示例图片
N002145-003 我们人工读数给文件名加后缀003(这一步没有捷径)

我们的核心思想用003和标注生成的xml文件中标签对比
在这里插入图片描述
那么就很容易实现了,这里使用python

import xml.etree.cElementTree as et
import os
path = r'D:/w h/test'
filenames = os.listdir(path)
for filename in filenames:
    tree=et.parse(filename)
    root=tree.getroot()
    filename=root.find('filename').text
    i = 7
    for Object in root.findall('object'):
        name=Object.find('name').text
        list1=[name]
        list5=filename
        i = i + 1
        if str(name)!=str(list5[i]):
            print("error")
            print(filename)

大功告成!(短短十几行代码)

在这里插入图片描述
居然有十八张错误0.0

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值