Python3将xml文件解析为Python对象

一、说明

从最开始写javascript开始,我就很烦感使用getElementById()等函数来获取节点的方法,获取了一个节点要访问其子孙节点要么child半天要么就再来一个getElementById(),这是智障吗?----所以我不喜欢beautiful soup(当然还因为他不支持xpath)。

python的json标准库可以将json结果直接解析为python对象;python也提供了好几个标准库来解析xml,但我不是很明白为什么都是一些不能直接将xml解析为python对象的垃圾库。

给一堆函数就叫功能强大吗,这次用了下次又得重新学简直脑残。

类似json将xml解析为python对象,可以使用第三方库untangle或xmltodict实现。

将以下内容保存为xml2obj.xml,后面我们就使用该文件。

<?xml version="1.0"?>
<root>
    <title>xml to python obj</title>
    <body>
        <section id="1">section1 content</section>
        <section id="2">section2 content</section>
    </body>
</root>

二、使用untangle将xml文件解析为python对象

pip install untangle

代码如下:

import untangle

# 将文件解析成对象
obj = untangle.parse('xml2obj.xml')

# 获取<title>标签内容
obj.root.title.__dict__['cdata']

# 获取第一个section标签
obj.root.body.section[0]

# 获取第二个section标签的id
obj.root.body.section[1]['id']

运行如下:
在这里插入图片描述

三、使用xmltodict将xml文件解析为python对象

pip install xmltodict

代码如下:

import xmltodict

# 将xml文件解析成对象
with open('xml2obj.xml') as fd:
    dict = xmltodict.parse(fd.read())

# 获取<title>标签内容
dict['root']['title']

# 获取第一个section标签
dict['root']['body']['section'][0]

# 获取第二个section标签的id
dict['root']['body']['section'][1]['@id']

运行如下:
在这里插入图片描述
xmltodict 也有unparse函数让您可以转回XML。
该函数有一个streaming模式适合用来 处理不能放入内存的文件,它还支持命名空间

参考:

https://www.cnblogs.com/lsdb/p/10150492.html
https://docs.python-guide.org/scenarios/xml/
https://blog.csdn.net/Baby_come_here/article/details/82688020

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Fu_Lin_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值