批量从.xml文件中把object的类别提取出来

这段代码遍历指定目录下的所有.xml文件,从中提取出每个文件中<object>标签的name属性值,将这些值存储到一个集合中,最终打印出所有不同的object类别。这个过程对于信息提取和数据预处理特别有用。

从一堆.xml标签文件中把object的类别提取出来

import xml.etree.ElementTree as ET
import os
import glob

file_dir = "E:\异物图片和标签\Annotations"
labelName = set([])

for files in os.walk(file_dir, topdown=False):
    pppg=files[2]

for i in range(1449):
    file_dir="E:/异物图片和标签/Annotations/"+pppg[i]
    files = glob.glob(file_dir)
    for i in range(len(files)):
        AnotPath = files[i]
        tree = ET.ElementTree(file=AnotPath)
        root = tree.getroot()
        ObjectSet = root.findall('object/name')
        for Object in ObjectSet:
            labelName.add(Object.text)

print(labelName)



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值