python批量拼接两个xml文件中的目标内容

最新推荐文章于 2024-04-30 11:11:45 发布

Make程序设计

最新推荐文章于 2024-04-30 11:11:45 发布

阅读量1k

点赞数 2

分类专栏：人工智能深度学习目标识别检测文章标签： python xml 开发语言数据集标签目标检测数据集处理

本文链接：https://blog.csdn.net/DeepLearning_/article/details/127711026

版权

深度学习同时被 3 个专栏收录

89 篇文章 19 订阅

订阅专栏

人工智能

68 篇文章 1 订阅

订阅专栏

目标识别检测

33 篇文章 15 订阅

订阅专栏

文章目录

脚本书写背景
一、完整程序如下
总结

脚本书写背景

深度学习项目中，肯定会遇到这种情况，比如有两个单独的数据集(数据集图片相同或者有重复的数据)，第一个数据集标签是睁眼、闭眼；另外一个数据集标签为打哈欠、人脸，标签格式都为voc格式，即xml文件。这时，我们不需要再任何一个数据集上再次标注想要的目标，而是可以通过python脚本，把两类xml合并成1个，操作非常的方便灵活，大大提高我们标注效率。一下是python脚本源码，欢迎使用~

提示：以下是本篇文章正文内容，下面案例可供参考

一、完整程序如下

from xml.etree.ElementTree import ElementTree, Element, parse
import xml.etree.ElementTree as ET
import os
import shutil

hole_path = r'F:\Red_Green_Light_data\A_s\rgyt_data\want_xml'
arm_path = r'F:\Red_Green_Light_data\A_s\rgyt_data\img363_xml'
out_path = r'F:\Red_Green_Light_data\A_s\rgyt_data\img363_xml2'

# 格式化
def __indent(elem, level=0):
    i = "\n" + level*"\t"
    if len(elem):
        if not elem.text or not elem.text.strip():
            elem.text = i + "\t"
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
        for elem in elem:
            __indent(elem, level+1)
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
    else:
        if level and (not elem.tail or not elem.tail.strip()):
            elem.tail = i


for hole_xml in os.listdir(hole_path):
    # 将同名xml合并
    if os.path.exists(os.path.join(arm_path,hole_xml)):
        print('fusing',hole_xml)
        tree_hole = parse(os.path.join(hole_path,hole_xml))
        root_hole = tree_hole.getroot()  # annotation

        new_hole = tree_hole

        tree_arm = parse(os.path.join(arm_path,hole_xml))
        root_arm = tree_arm.getroot()  # annotation
        object = (tree_arm.findall('object'))
        for i in range(len(object)):
            root_hole.append(object[i])
        __indent(root_hole)
        new_hole.write(os.path.join(out_path,hole_xml))
    # 不同名xml复制
    else:
        print('copying',hole_xml)
        shutil.copy(os.path.join(hole_path,hole_xml), out_path)


# 将不同名xml复制
for arm_xml in os.listdir(arm_path):
    if not os.path.exists(os.path.join(out_path,arm_xml)):
        print('copying')
        shutil.copy(os.path.join(arm_path, arm_xml), out_path)