读取xml文件小示例

最新推荐文章于 2024-07-28 17:49:02 发布

MagiChos

最新推荐文章于 2024-07-28 17:49:02 发布

阅读量1.2k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/hanshuobest/article/details/78604704

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

刚好用到了读取xml文件，这里就用一个小例子加深记忆，也方便以后查找。
下面是一个xml文件

<annotation>
    <folder>VOC2012</folder>
    <filename>2007_000027.jpg</filename>
    <source>
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
    </source>
    <size>
        <width>486</width>
        <height>500</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>174</xmin>
            <ymin>101</ymin>
            <xmax>349</xmax>
            <ymax>351</ymax>
        </bndbox>
        <part>
            <name>head</name>
            <bndbox>
                <xmin>169</xmin>
                <ymin>104</ymin>
                <xmax>209</xmax>
                <ymax>146</ymax>
            </bndbox>
        </part>
        <part>
            <name>hand</name>
            <bndbox>
                <xmin>278</xmin>
                <ymin>210</ymin>
                <xmax>297</xmax>
                <ymax>233</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>273</xmin>
                <ymin>333</ymin>
                <xmax>297</xmax>
                <ymax>354</ymax>
            </bndbox>
        </part>
        <part>
            <name>foot</name>
            <bndbox>
                <xmin>319</xmin>
                <ymin>307</ymin>
                <xmax>340</xmax>
                <ymax>326</ymax>
            </bndbox>
        </part>
    </object>
</annotation>

现在要读取文件名，图片尺寸以及bndbox，下面代码展示读取方式。

import numpy as np
import xml.etree.ElementTree as ET

et = ET.parse('2007_000032.xml')
element = et.getroot()

# 获取所有object对象
element_objs = element.findall('object')
# 图片文件名
element_filename = element.find('filename').text
print('element_filename:' , element_filename)
element_width = int(element.find('size').find('width').text)
element_height = int(element.find('size').find('height').text)

if len(element_objs) > 0:
    for element_obj in element_objs:
        class_name = element_obj.find('name').text
        print('class_name:' , class_name)

        obj_bbox = element_obj.find('bndbox')
        x1 = int(round(float(obj_bbox.find('xmin').text)))
        y1 = int(round(float(obj_bbox.find('ymin').text)))
        x2 = int(round(float(obj_bbox.find('xmax').text)))
        y2 = int(round(float(obj_bbox.find('ymax').text)))
        print('(x1,y1,x2,y2):' , (x1 , y1 , x2 , y2))