Python3将xml文件解析为对象

一、说明

类似json将xml解析为python对象,可以使用第三方库untangle或xmltodict实现。
将以下内容保存为xml2obj.xml,后我我们就使用该文件。
1.第一行的<?xml version="1.0" encoding="UTF-8"?>是xml文件的声明,它定义了xml的版本 (1.0)和所使用编码为UTF-8。
2.接下来就是xml文件的内容了,这些内容按一个树状结构进行组织摆放,形式如下:

<?xml version="1.0"?>
<root>
    <title>xml to python obj</title>
    <body>
        <section id="1">section1 content</section>
        <section id="2">section2 content</section>
    </body>
</root>

其中,每一个.叫做一个节点,也叫一个元素,节点可以嵌套放置,也可以并列放置,在嵌套结构中,内外层节点是父子关系,以此类推,最外层的节点都叫做根节点。并列的两节点为兄弟关系。
3.对于每一个节点,一般由Tag、Attribute、Text三部分构成。在country_data.xml中data,country,rank,year这些都是tag。与tag同一尖括弧内右边的是Attribute,比如:name。Text就是两个尖括弧中间夹的东西了。

二、使用untangle将xml文件解析为python对象

pip install untangle

import untangle
#将文件解析成对象
obj = untangle.parse('xml2obj.xml')
#获取<title>标签内容
obj.root.title.__dict__['cdata']
#获取第一个section标签
obj.root.body.section[0]
#获取第二个section标签的id
obj.root.body.section[1]['id']

三、使用xmltodict将xml文件解析为python对象

pip install xmltodict

import xmltodict
#将xml文件解析成对象
with open('xml2obj.xml') as fd:
    dict = xmltodict.parse(fd.read())

#获取<title>标签内容
dict['root']['title']

#获取第一个section标签
dict['root']['body']['section'][0]

#获取第二个section标签的id
dict['root']['body']['section'][1]['@id']

四、xml.etree.ElementTree

ElementTree生来就是为了处理XML,它在Python标准库中有两种实现:一种是纯Python实现的&#x

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值