下面这行代码是用于来检测xml文件里们标签名和个数:
只适用于像voc那样的xml标签文件:
import xml.etree.ElementTree as ET
import os
from collections import Counter
xml_position=r'B:\software\deeplearning\数据集\voc\VOCdevkit\Annotations' #你放置xml文件的目录
xml_name=os.listdir(xml_position)
hyj=[]
hyj2=[]
for i in xml_name:
xml_position1=os.path.join(xml_position,i)
position=ET.parse(xml_position1)
root=position.getroot()
picture_name=root.find('filename').text
hyj.append(picture_name)
label_name=root.findall('object/name')
for i in label_name:
hyj2.append(i.text)
label_counts=Counter(hyj2)
print("标签统计:")
for label, count in label_counts.items():
print(f"{label}: {count}")
print(len(hyj))
如果xml文件过多需要等待一会。没有写载入的动画。
xml格式如下图,仅适用于一下内容!!!!!!!!标签最好别是中文