目标检测任务统计xml数据集中类别和个数

这段代码用于读取VOC格式的XML数据集,使用xml.etree.ElementTree模块解析XML文件,获取filename和object/name标签的内容。它统计了不同对象标签的出现数量,并打印出结果。如果XML文件数量多,程序会稍有延迟,未添加加载动画。
摘要由CSDN通过智能技术生成

下面这行代码是用于来检测xml文件里们标签名和个数:

只适用于像voc那样的xml标签文件:

import xml.etree.ElementTree as ET
import os

from collections import Counter

xml_position=r'B:\software\deeplearning\数据集\voc\VOCdevkit\Annotations' #你放置xml文件的目录
xml_name=os.listdir(xml_position)
hyj=[]

hyj2=[]
for i in xml_name:
    xml_position1=os.path.join(xml_position,i)
    position=ET.parse(xml_position1)
    root=position.getroot()
    picture_name=root.find('filename').text
    hyj.append(picture_name)
    label_name=root.findall('object/name')
    for i in label_name:
        hyj2.append(i.text)


label_counts=Counter(hyj2)
print("标签统计:")
for label, count in label_counts.items():
    print(f"{label}: {count}")


print(len(hyj))

如果xml文件过多需要等待一会。没有写载入的动画。

xml格式如下图,仅适用于一下内容!!!!!!!!标签最好别是中文

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值