XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。
它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。
常见的 XML 编程接口有 DOM 和 SAX,这两种接口处理 XML 文件的方式不同,当然使用场合也不同。
Python 有三种方法解析 XML,SAX,DOM,以及 ElementTree:
1.SAX (simple API for XML )
Python 标准库包含 SAX 解析器,SAX 用事件驱动模型,通过在解析 XML 的过程中触发一个个的事件并调用用户定义的回调函数来处理 XML 文件。
2.DOM(Document Object Model)
将 XML 数据在内存中解析成一个树,通过对树的操作来操作 XML。 movies.xml 内容如下:
<collection shelf="New Arrivals">
<movie title="Enemy Behind">
<type>War, Thriller</type>
<format>DVD</format>
<year>2003</year>
<rating>PG</rating>
<stars>10</stars>
<description>Talk about a US-Japan war</description>
</movie>
<movie title="Transfo

本文介绍了Python3中XML的解析方法,包括SAX和DOM两种主要接口。SAX采用事件驱动模型,适合处理大型文件,而DOM则将XML数据转化为内存中的树形结构,适用于需要全面访问文档内容的场景。通过ContentHandler类方法可以实现SAX解析,而xml.dom.minidom模块则用于DOM解析。
最低0.47元/天 解锁文章
687

被折叠的 条评论
为什么被折叠?



