自建数据集系列:xml标注文件的节点、属性、文本的修正

前言

不知为何,labelImg标注文件xml的width与height的节点文本都为0
在这里插入图片描述
然后可想而知,在yolo进行尺度归一的时候,除了个0,哎呦我去.

改造

主要参考的是这篇文章:https://blog.csdn.net/weixin_42784169/article/details/111401802

modifyXmlText.py

# -*- coding: utf-8 -*-
from xml.etree.ElementTree import ElementTree,Element


def read_xml(in_path):
    '''''读取并解析xml文件
       in_path: xml路径
       return: ElementTree'''
    tree = ElementTree()
    tree.parse(in_path)
    return tree

def write_xml(tree, out_path):
    '''''将xml文件写出
       tree: xml树
       out_path: 写出路径'''
    tree.write(out_path, encoding="utf-8", xml_declaration=True)

def if_match(node, kv_map):
    '''''判断某个节点是否包含所有传入参数属性
       node: 节点
       kv_map: 属性及属性值组成的map'''
    for key in kv_map:
        if node.get(key) != kv_map.get(key):
            return False
    return True

# ----------------search -----------------
def find_nodes(tree, path):
    '''''查找某个路径匹配的所有节点
       tree: xml树
       path: 节点路径'''
    return tree.findall(path)

def get_node_by_keyvalue(nodelist, kv_map):
    '''''根据属性及属性值定位符合的节点,返回节点
       nodelist: 节点列表
       kv_map: 匹配属性及属性值map'''
    result_nodes = []
    for node in nodelist:
        if if_match(node, kv_map):
            result_nodes.append(node)
    return result_nodes

# ---------------change ----------------------
def change_node_properties(nodelist, kv_map, is_delete=False):
    '''修改/增加 /删除 节点的属性及属性值
       nodelist: 节点列表
       kv_map:属性及属性值map'''
    for node in nodelist:
        for key in kv_map:
            if is_delete:
                if key in node.attrib:
                    del node.attrib[key]
            else:
                node.set(key, kv_map.get(key))

def change_node_text(nodelist, text, is_add=False, is_delete=False):
    '''''改变/增加/删除一个节点的文本
       nodelist:节点列表
       text : 更新后的文本'''
    for node in nodelist:
        if is_add:
            node.text += text
        elif is_delete:
            node.text = ""
        else:
            node.text = text

def create_node(tag, property_map, content):
    '''新造一个节点
       tag:节点标签
       property_map:属性及属性值map
       content: 节点闭合标签里的文本内容
       return 新节点'''
    element = Element(tag, property_map)
    element.text = content
    return element

def add_child_node(nodelist, element):
    '''''给一个节点添加子节点
       nodelist: 节点列表
       element: 子节点'''
    for node in nodelist:
        node.append(element)


def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
    '''''同过属性及属性值定位一个节点,并删除之
       nodelist: 父节点列表
       tag:子节点标签
       kv_map: 属性及属性值列表'''
    for parent_node in nodelist:
        children = parent_node.getchildren()
        for child in children:
            if child.tag == tag and if_match(child, kv_map):
                parent_node.remove(child)
# 使用示例
# if __name__ == "__main__":
#     ################ 1. 读取xml文件  ##########
#     tree = read_xml("test_02.xml")

#     ################ 2. 属性修改 ###############
#     nodes = find_nodes(tree, "processers/processer")                   # 找到父节点
#     result_nodes = get_node_by_keyvalue(nodes, {"name": "BProcesser"}) # 通过属性准确定位子节点
#     change_node_properties(result_nodes, {"age": "1"})                 # 修改节点属性
#     change_node_properties(result_nodes, {"value": ""}, True)          # 删除节点属性

#     #################  3. 节点修改 ##############
#     a = create_node("person", {"age": "15", "money": "200000"}, "this is the firest content") # 新建节点
#     add_child_node(result_nodes, a) # 插入到父节点之下

#     ################# 4. 删除节点 ################
#     del_parent_nodes = find_nodes(tree, "processers/services/service")                            # 定位父节点
#     target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency": "chain1"})  # 准确定位子节点并删除之

#     ################# 5. 修改节点文本 ############
#     text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency": "chain3"}) # 定位节点
#     change_node_text(text_nodes, "new text")

#     ################ 6. 输出到结果文件  ##########
#     write_xml(tree, "./xiugai.xml")


from glob import glob
import cv2

if __name__ == "__main__":
    # 1.标签路径
    labelme_path = "/home/xyf/AllIn/CAM/YOLOX/datasets/VOCdevkit/VOC2007/Annotations/"
    #原始labelme标注数据路径
    saved_path = "VOC2007/"
    files = glob(labelme_path + "radar*.xml")  # car oil radar
    # 4.读取标注信息并写入 xml
    for file in files:
        # file = "/home/xyf/AllIn/CAM/YOLOX/datasets/VOCdevkit/VOC2007/Annotations/car2.xml"
        print(file)
        img_path = file.replace("Annotations","JPEGImages").replace(".xml",".jpg")
        height, width, channels = cv2.imread(img_path).shape
          
        tree = read_xml(file)
        text_width = get_node_by_keyvalue(find_nodes(tree, "size/width"),{})
        change_node_text(text_width, str(width))
        text_height = get_node_by_keyvalue(find_nodes(tree, "size/height"),{})
        change_node_text(text_height, str(height))

        write_xml(tree, file)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星空•物语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值