从一堆.xml标签文件中把object的类别提取出来
import xml.etree.ElementTree as ET
import os
import glob
file_dir = "E:\异物图片和标签\Annotations"
labelName = set([])
for files in os.walk(file_dir, topdown=False):
pppg=files[2]
for i in range(1449):
file_dir="E:/异物图片和标签/Annotations/"+pppg[i]
files = glob.glob(file_dir)
for i in range(len(files)):
AnotPath = files[i]
tree = ET.ElementTree(file=AnotPath)
root = tree.getroot()
ObjectSet = root.findall('object/name')
for Object in ObjectSet:
labelName.add(Object.text)
print(labelName)
这段代码遍历指定目录下的所有.xml文件,从中提取出每个文件中<object>标签的name属性值,将这些值存储到一个集合中,最终打印出所有不同的object类别。这个过程对于信息提取和数据预处理特别有用。
1435

被折叠的 条评论
为什么被折叠?



