python解析xml文件增删查找

本文介绍如何使用Python解析XML文件,重点在于批量处理XML中的bndbox大小判断,添加difficult子节点,并进行文件的增删查找操作。虽然已实现功能,但因大量使用for循环导致效率较低,需注意保存修改后的文件。
摘要由CSDN通过智能技术生成

python解析xml文件增删查找

XML文件

在这里插入图片描述

判断bndbox大小,并为object添加子节点difficult

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import os
import os.path
from xml.etree import ElementTree as ET

path='C:/Users/my/Desktop/xmllll/city/1'
new_path='C:/Users/my/Desktop/xmllll/city/1/'
files=os.listdir(path) #得到文件夹下所有文件名称
my_area = int(input("请输入area区域大小:"))
# my_area = 20
for xmlFile in files: #遍历文件夹
    if not os.path.isdir(xmlFile): #判断是否是文件夹,不是文件夹才打开
        print(xmlFile)
        per = ET.parse(new_path + xmlFile)
        p=per.findall('./object')
        number_name = 0
        area = []
        # print(type(my_area))
        for oneper in p:  #找出object节点
            for child in oneper.getchildren(): #找出object节点的子节点bndbox/name
                for grandson in child.getchildren(): #找出bndbox节点的子节点
                    area.append(int(child.find('xmin').text))
                    area.append(int(child.find('ymin').text))
                    area.append(int(child.find('xmax').text))
                    area.append(int(child.find('ymax').text))
                    if len(area) == 4:
                        element = ET.Element("difficult")  
                        if ((area[2]-area[0]) > my_area) & ((area[3]-area[1])> my_area):
                                element.text = "0"
                        else:
                                element.text = "1"
                        oneper.insert(1,element)
                        per.write(new_path + xmlFile, encoding="utf-8",xml_declaration=True)
                    area.clear()
                    break
        print('-------')

  1. 该文件可以批处理xml文件
  2. 可以添加子节点,索引
  3. 但是存在速度问题,一直没法提高速度,应该和使用了大量for循环有关
  4. 注意:修改的xml文件是缓存在内存当中的,因此一定要保存
  5. 添加子节点可以用append或者insert,指定位置用insert

Result

在这里插入图片描述

xml增删查找

# -*- coding: utf-8 -*-
"""
Created on Mon Mar 18 17:36:45 2019
@author: psqk
"""
#!/usr/bin/env python
# -*- coding: utf8 -*-

from xml.etree import ElementTree
from xml.etree.ElementTree import Element, SubElement
from lxml import etree
import codecs

XML_EXT = '.xml'
ENCODE_METHOD = 'utf-8'

class PascalVocWriter:

    def __init__(self, foldername, filename, imgSize,databaseSrc='Unknown', localImgPath=None):
        self.foldername = foldername
        self.filename = filename
        self.databaseSrc = databaseSrc
        self.imgSize = imgSize
        self.boxlist = []
        self.localImgPath = localImgPath
        self.verified = False

    def prettify(self, elem):
        """
            Return a pretty-printed XML string for the Element.
        """
        rough_string = ElementTree.tostring(elem, 'utf8')
        root
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值