python解析xml文件增删查找

最新推荐文章于 2024-06-12 14:38:38 发布

Counting_Stars_

最新推荐文章于 2024-06-12 14:38:38 发布

阅读量1.8k

点赞数 2

分类专栏： Python 文章标签：解析xml python 批处理

本文链接：https://blog.csdn.net/tanghong1996/article/details/88657307

版权

本文介绍如何使用Python解析XML文件，重点在于批量处理XML中的bndbox大小判断，添加difficult子节点，并进行文件的增删查找操作。虽然已实现功能，但因大量使用for循环导致效率较低，需注意保存修改后的文件。

摘要由CSDN通过智能技术生成

python解析xml文件增删查找

XML文件

在这里插入图片描述

判断bndbox大小，并为object添加子节点difficult

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import os
import os.path
from xml.etree import ElementTree as ET

path='C:/Users/my/Desktop/xmllll/city/1'
new_path='C:/Users/my/Desktop/xmllll/city/1/'
files=os.listdir(path) #得到文件夹下所有文件名称
my_area = int(input("请输入area区域大小："))
# my_area = 20
for xmlFile in files: #遍历文件夹
    if not os.path.isdir(xmlFile): #判断是否是文件夹，不是文件夹才打开
        print(xmlFile)
        per = ET.parse(new_path + xmlFile)
        p=per.findall('./object')
        number_name = 0
        area = []
        # print(type(my_area))
        for oneper in p:  #找出object节点
            for child in oneper.getchildren(): #找出object节点的子节点bndbox/name
                for grandson in child.getchildren(): #找出bndbox节点的子节点
                    area.append(int(child.find('xmin').text))
                    area.append(int(child.find('ymin').text))
                    area.append(int(child.find('xmax').text))
                    area.append(int(child.find('ymax').text))
                    if len(area) == 4:
                        element = ET.Element("difficult")  
                        if ((area[2]-area[0]) > my_area) & ((area[3]-area[1])> my_area):
                                element.text = "0"
                        else:
                                element.text = "1"
                        oneper.insert(1,element)
                        per.write(new_path + xmlFile, encoding="utf-8",xml_declaration=True)
                    area.clear()
                    break
        print('-------')

该文件可以批处理xml文件
可以添加子节点，索引
但是存在速度问题，一直没法提高速度，应该和使用了大量for循环有关
注意：修改的xml文件是缓存在内存当中的，因此一定要保存
添加子节点可以用append或者insert，指定位置用insert

Result

在这里插入图片描述

xml增删查找

# -*- coding: utf-8 -*-
"""
Created on Mon Mar 18 17:36:45 2019
@author: psqk
"""
#!/usr/bin/env python
# -*- coding: utf8 -*-

from xml.etree import ElementTree
from xml.etree.ElementTree import Element, SubElement
from lxml import etree
import codecs

XML_EXT = '.xml'
ENCODE_METHOD = 'utf-8'

class PascalVocWriter:

    def __init__(self, foldername, filename, imgSize,databaseSrc='Unknown', localImgPath=None):
        self.foldername = foldername
        self.filename = filename
        self.databaseSrc = databaseSrc
        self.imgSize = imgSize
        self.boxlist = []
        self.localImgPath = localImgPath
        self.verified = False

    def prettify(self, elem):
        """
            Return a pretty-printed XML string for the Element.
        """
        rough_string = ElementTree.tostring(elem, 'utf8')
        root

最低0.47元/天解锁文章

Counting_Stars_

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
python解析xml文件增删查找

python解析xml文件增删查找XML文件判断bndbox大小，并为object添加子节点difficult#!/usr/bin/env python# -*- coding:utf-8 -*-import osimport os.pathfrom xml.etree import ElementTree as ETpath='C:/Users/my/Desktop/xml...
复制链接

扫一扫

专栏目录