xml篇---修改,删除xml中指定标签,判断xml中标签是否为空

1. 删除xml中指定标签

# -- coding: utf-8 --
import os
import xml.etree.ElementTree as ET


# -----------------------------------
# 删除xml中指定的标签信息
# -----------------------------------
# 设置原始标签路径为 Annos
origin_ann_dir = '/app/yyq/dataset/second_project/error_dataset2021/Annotations/'  
# 设置新标签路径 Annotations
new_ann_dir = '/app/yyq/dataset/second_project/error_dataset2021/Annotations-new/'  

if not os.path.exists(new_ann_dir):
    os.makedirs(new_ann_dir)
    
k = 0
# os.walk游走遍历目录名
for dirpaths, dirnames, filenames in os.walk(origin_ann_dir):  
    for filename in filenames:
        print("process...")
        k = k + 1
        print(k)
        # 获取原始xml文件绝对路径,isfile()检测是否为文件 isdir检测是否为目录
        if os.path.isfile(r'%s%s' % (origin_ann_dir, filename)):
            # 如果是,获取绝对路径(重复代码)
            origin_ann_path = os.path.join(r'%s%s' % (origin_ann_dir, filename))  
            new_ann_path = os.path.join(r'%s%s' % (new_ann_dir, filename))
            # ET是一个xml文件解析库,ET.parse()打开xml文件。parse--"解析"
            tree = ET.parse(origin_ann_path)
            # 获取根节点
            root = tree.getroot()
            # 找到根节点下所有“object”节点
            for object in root.findall('object'):
                # 找到object节点下name子节点的值(字符串)
                name = str(object.find('name').text) 
                # 如果name等于str,则删除该节点
                if (name in ["Electromobile"]):
                    root.remove(object)
                if (name in ["Bicycle"]):
                    root.remove(object)
                if (name in ["vehicle"]):
                    root.remove(object)

            # tree为文件,write写入新的文件中。
            tree.write(new_ann_path)  

2. 判断xml中标签是否为空,并移动xml和相应图片到指定路径

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# 移动标签为空的xml,并同步移动相应图片
import os
import xml.etree.ElementTree as ET
import shutil


# 设置原始标签路径为 Annos
origin_ann_dir = '/app/yyq/dataset/second_project/error_dataset2021/Annotations/'  
# 设置新标签路径 Annotations
new_ann_dir = '/app/yyq/dataset/second_project/error_dataset2021/Annotations-new/'  
origin_pic_dir = '/app/yyq/dataset/second_project/error_dataset2021/JPEGImages/'
new_pic_dir = '/app/yyq/dataset/second_project/error_dataset2021/JPEGImages-new'

if not os.path.exists(new_ann_dir):
    os.makedirs(new_ann_dir)
if not os.path.exists(new_pic_dir):
    os.makedirs(new_pic_dir)

k = 0
p = 0
q = 0
# os.walk游走遍历目录名
for dirpaths, dirnames, filenames in os.walk(origin_ann_dir):  
    for filename in filenames:
        print("process...")
        k = k + 1
        print(k)
        # 获取原始xml文件绝对路径,isfile()检测是否为文件 isdir检测是否为目录
        if os.path.isfile(r'%s%s' % (origin_ann_dir, filename)):
            # 如果是,获取绝对路径(重复代码)
            origin_ann_path = os.path.join(r'%s%s' % (origin_ann_dir, filename))  
            new_ann_path = os.path.join(r'%s%s' % (new_ann_dir, filename))
            # ET是一个xml文件解析库,ET.parse()打开xml文件。parse--"解析"
            tree = ET.parse(origin_ann_path)
            # 获取根节点
            root = tree.getroot() 
            if len(root.findall('object')):
                p = p + 1
            else:
                print(filename)
                old_xml = origin_ann_dir + filename
                new_xml = new_ann_dir + filename
                old_pic = origin_pic_dir + filename.replace("xml", "jpg")
                new_pic = new_pic_dir + filename.replace("xml", "jpg")
                q = q + 1
                shutil.move(old_pic, new_pic)
                shutil.move(old_xml, new_xml)
print("ok, ", p)
print("empty, ", q)

3. 修改xml中指定标签

# -- coding: utf-8 --
import os
import xml.etree.ElementTree as ET


# -----------------------------------
# 删除xml中指定的标签信息
# -----------------------------------
# 设置原始标签路径为 Annos
origin_ann_dir = '/app/yyq/dataset/third_project/fivechaos_dataset2021/Annotations/'
# 设置新标签路径 Annotations
new_ann_dir = '/app/yyq/dataset/third_project/fivechaos_dataset2021/Annotations-new/'

if not os.path.exists(new_ann_dir):
    os.makedirs(new_ann_dir)

k = 0
# os.walk游走遍历目录名
for dirpaths, dirnames, filenames in os.walk(origin_ann_dir):
    for filename in filenames:
        print("process...")
        k = k + 1
        print(k)
        # 获取原始xml文件绝对路径,isfile()检测是否为文件 isdir检测是否为目录
        if os.path.isfile(r'%s%s' % (origin_ann_dir, filename)):
            # 如果是,获取绝对路径(重复代码)
            origin_ann_path = os.path.join(r'%s%s' % (origin_ann_dir, filename))
            new_ann_path = os.path.join(r'%s%s' % (new_ann_dir, filename))
            # ET是一个xml文件解析库,ET.parse()打开xml文件。parse--"解析"
            tree = ET.parse(origin_ann_path)
            # 获取根节点
            root = tree.getroot()
            # 找到根节点下所有“object”节点
            for object in root.findall('object'):
                # 找到object节点下name子节点的值(字符串)
                name = str(object.find('name').text)
                # 如果name等于str,将标签从原来的non_vehicle_parking修改为parking
                if (name in ["non_vehicle_parking"]):
                    object.find('name').text = "parking"

            # tree为文件,write写入新的文件中。
            tree.write(new_ann_path)
  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心惠天意

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值