利用Python获取VOC中的xml标注文件中的目标框

最新推荐文章于 2022-12-20 16:36:22 发布

粼粼淇

最新推荐文章于 2022-12-20 16:36:22 发布

阅读量5.8k

点赞数 7

分类专栏： # PyFasterRCNN Python

本文链接：https://blog.csdn.net/lingyunxianhe/article/details/81808539

版权

Python 同时被 2 个专栏收录

77 篇文章 1 订阅

订阅专栏

PyFasterRCNN

18 篇文章 0 订阅

订阅专栏

首先引用这篇博客：https://www.cnblogs.com/xiaobingqianrui/p/8405813.html 中解说的关于python解析xml文件的一些方法，如下：

python解析XML常见的有三种方法：一是xml.dom.*模块，它是W3C DOM API的实现，若需要处理DOM API则该模块很适合；二是xml.sax.*模块，它是SAX API的实现，这个模块牺牲了便捷性来换取速度和内存占用，SAX是一个基于事件的API，这就意味着它可以“在空中”处理庞大数量的的文档，不用完全加载进内存；三是xml.etree.ElementTree模块（简称 ET），它提供了轻量级的Python式的API，相对于DOM来说ET 快了很多，而且有很多令人愉悦的API可以使用，相对于SAX来说ET的ET.iterparse也提供了 “在空中” 的处理方式，没有必要加载整个文档到内存，ET的性能的平均值和SAX差不多，但是API的效率更高一点而且使用起来很方便。

上述博客关于python解析xml文件过程还是比较详尽的，并且网上有关此类的文章也有很多，每种方法均有优劣，而且有时你搭建程序时还要考虑如：最熟悉哪种方法？前后工程使用的方法是否统一？读取解析的速度要求等等，因为我是参照PyFasterRCNN程序中有关读取xml文件的部分，它采用的是xml.etree.ElementTree模块，它把xml文件解析成一棵树，每一个节点上存放一个关键字或关键字和其值。这种数据树型数据结构十分清晰明了。下面上一段读取VOC中xml文件中的目标矩形框的程序，依程序带动解析xml文件的大致过程。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 2018/08/15 by DQ
# get annotation object bndbox location
try:
    import xml.etree.cElementTree as ET  #解析xml的c语言版的模块
except ImportError:
    import xml.etree.ElementTree as ET
											         
##get object annotation bndbox loc start 
def GetAnnotBoxLoc(AnotPath):#AnotPath VOC标注文件路径
    tree = ET.ElementTree(file=AnotPath)  #打开文件，解析成一棵树型结构
    root = tree.getroot()#获取树型结构的根
    ObjectSet=root.findall('object')#找到文件中所有含有object关键字的地方，这些地方含有标注目标
    ObjBndBoxSet={} #以目标类别为关键字，目标框为值组成的字典结构
    for Object in ObjectSet:
        ObjName=Object.find('name').text
        BndBox=Object.find('bndbox')
        x1 = int(BndBox.find('xmin').text)#-1 #-1是因为程序是按0作为起始位置的
        y1 = int(BndBox.find('ymin').text)#-1
        x2 = int(BndBox.find('xmax').text)#-1
        y2 = int(BndBox.find('ymax').text)#-1
        BndBoxLoc=[x1,y1,x2,y2]
        if ObjBndBoxSet.has_key(ObjName):
        	ObjBndBoxSet[ObjName].append(BndBoxLoc)#如果字典结构中含有这个类别了，那么这个目标框要追加到其值的末尾
        else:
        	ObjBndBoxSet[ObjName]=[BndBoxLoc]#如果字典结构中没有这个类别，那么这个目标框就直接赋值给其值吧
    return ObjBndBoxSet
##get object annotation bndbox loc end

使用xml.etree.ElementTree模块解析xml是很简单的，有读取xml的需要，也有创建xml的时候，也是使用这个模块，当然也是比较简单的，后面抽时间写点