Python XML的解析与创建

最新推荐文章于 2024-08-06 17:00:20 发布

拉垮的我

最新推荐文章于 2024-08-06 17:00:20 发布

阅读量2.6k

点赞数

分类专栏： Python 文章标签： python api xml解析 xml-dom ElementTre

本文链接：https://blog.csdn.net/SeeTheWorld518/article/details/49535211

版权

本文介绍了Python中处理XML的三种方法：SAX、DOM和ElementTree。SAX采用事件驱动模型，适合处理大型文件；DOM将XML转换为内存中的树结构，适合小文件；ElementTree作为DOM的轻量级替代，提供了易用且高效的API。同时，文章详细讲解了xml.dom模块的解析方法和常用API，包括parse()、getElementsByTagName()、getAttribute()等。

摘要由CSDN通过智能技术生成

常见的XML编程接口有DOM和SAX，这两种接口处理XML文件的方式不同，当然是用是用场合也不同。
Python有三种方法解析XML：

SAX（不常用）
DOM
ElementTree

SAX（simple API for XML）

Python标准库中包含SAX解析器，SAX是用的是事件驱动模型，通过在解析XML过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。
解析的基本过程：
读到一个XML开始标签，就会开始一个事件，然后事件就会调用一系列的函数去处理一些事情，当读到一个结束标签时，就会触发另一个事件。所以，我们写XML文档入如果有格式错误的话，解析就会出错。
这是一种流式处理，一边读一边解析，占用内存少，可以处理一些大的文件，但是把大文件读到缓存中缓存起来就比较难，这样就会影响效率。

DOM（Document Object Model）

将XML数据在内存中解析成一个树，通过对树的操作来操作XML。
由于DOM是将XML读取到内存，然后解析成一个树，如果要处理的XML文本比较大的话，就会很耗内存，所以DOM一般偏向于处理一些小的XML，（如配置文件）比较快，

ElementTree（Object Model）

ElementTree就像一个轻量级的DOM，具有方便而友好的API。代码的可用性好、速度快、消耗内存少。可以认为是对DOM的改进。

XML解析基本思路是

现将xml文档内容一次性全部读入内存并解析成树结构，然后拿到这个树结构的根结点，然后我们就可以通过调用解析XML的一些函数来操作这个树了，也就是操作xml文档数据。

xml.dom解析xml

文件对象模型（Document Object Model，简称DOM），是W3C组织推荐处理可扩展语言的标准编程接口。
一个 DOM 的解析器在解析一个 XML 文档时，一次性读取整个文档，把文档中所有元素保存在内存中的一个树结构里，之后你可以利用DOM 提供的不同的函数来读取或修改文档的内容和结构，也可以把修改过的内容写入xml文件。
下面是一个简单的xml文档实例（book.xml）：

<?xml version="1.0" encoding="utf-8" ?>
<!--this is a test about xml.-->
<booklist type="science and engineering">
    <book category="math">
        <title>learning math</title>
        <author>张三</author>
        <pageNumber>561</pageNumber>
    </book>
    <book category="Python">
        <title>learning Python</title>
        <author>李四</author>
        <pageNumber>600</pageNumber>
    </