python读写xml用什么包最好_Python 使用minidom读写xml

最新推荐文章于 2024-08-01 09:25:57 发布

譃七唯

最新推荐文章于 2024-08-01 09:25:57 发布

阅读量225

点赞数

文章标签： python读写xml用什么包最好

本文链接：https://blog.csdn.net/weixin_35450193/article/details/113990196

版权

http://www.cnblogs.com/itech/archive/2011/01/06/1924972.html

一 python提供的xml支持

2种工业标准的xml解析方法-SAX和DOM。SAX(simple API for XML)，是基于事件处理的，当XML文档顺序地读入时，每次遇到一个元素会触发相应的事件处理函数来处理。DOM(Document Object Model)，通过构建一个树结构来表现整个xml文档，一旦树被构建，可以通过DOM提供了接口来遍历树和提取相应的数据。

python还提供了python独特的xml解析方法，相比于SAX和DOM更容易使用和更加快速，此方法为ElementTree。

python的xml模块为：

1)xml.dom.minidom

2)xml.elementtree

3)xml.sax + xml.dom

二 xml实例：(employees.xml)

xml version="1.0" encoding="UTF-8"

employees

employee

name

inux

name

age

employee

name

>windows

name

age

employee

employees

三使用xml.dom.minidom来读写xml

1)使用xml.dom.minidom来解析xml：

def

TestMiniDom():

from

xml.dom

import

minidom

doc

minidom.parse(

employees.xml

)

get root element:

root

doc.documentElement

get all children elements:

employees

root.getElementsByTagName(

employee

)

for

employee

employees:

(

-------------------------------------------

)

element name : employee

(employee.nodeName)

element xml content : windows20

basically equal to toprettyxml function

(employee.toxml())

nameNode

employee.getElementsByTagName(

name

)[0]

(nameNode.childNodes)

(nameNode.nodeName

nameNode.childNodes[0].nodeValue)

ageNode

employee.getElementsByTagName(

age

)[0]

(ageNode.childNodes)

(ageNode.nodeName

ageNode.childNodes[0].nodeValue)

(

-------------------------------------------

)

children nodes : \n is one text element

[

]

for

employee.childNodes:

(n)

TestMiniDom()

运行结果：

-------------------------------------------

employee

name

linux

name

age

employee

[

DOM

Text node "'linux'"

]

name:linux

[

DOM

Text node "'30'"

]

age:30

-------------------------------------------

DOM

Text node "' \n '"

DOM

Element: name at 0xc9f590

DOM

Text node "'\n '"

DOM

Element: age at 0xc9f5f0

DOM

Text node "'\n '"

-------------------------------------------

employee

name

windows

name

age

employee

[

DOM

Text node "'windows'"

]

name:windows

[

DOM

Text node "'20'"

]

age:20

-------------------------------------------

DOM

Text node "' \n '"

DOM

Element: name at 0xc9f6b0

DOM

Text node "'\n '"

DOM

Element: age at 0xc9f710

DOM

Text node "'\n '"

2)使用xml.dom.minidom来生成xml:

def

GenerateXml():

import

xml.dom.minidom

impl

xml.dom.minidom.getDOMImplementation()

dom

impl.createDocument(None,

employees

, None)

root

dom.documentElement

employee

dom.createElement(

employee

)

root.appendChild(employee)

nameE

dom.createElement(

name

)

nameT

dom.createTextNode(

linux

)

nameE.appendChild(nameT)

employee.appendChild(nameE)

ageE

dom.createElement(

age

)

ageT

dom.createTextNode(

)

ageE.appendChild(ageT)

employee.appendChild(ageE)

open(

employees2.xml

, encoding

utf-8

)

dom.writexml(f,

addindent

, newl

,encoding

utf-8

)

f.close()

GenerateXml()

运行结果：

xml version="1.0" encoding="utf-8"

employees

employee

name

linux

name

age

employee

employees

3)使用xml.dom.minidom需要注意的

*使用parse()或createDocument()返回的为DOM对象；

*使用DOM的documentElement属性可以获得Root Element;

*DOM为树形结构，包含许多的nodes，其中element是node的一种，可以包含子elements，textNode也是node的一种，是最终的子节点；

*每个node都有nodeName，nodeValue，nodeType属性，nodeValue是结点的值，只对textNode有效。对于textNode，想得到它的文本内容可以使用: .data属性。

*nodeType是结点的类型，现在有以下：

'ATTRIBUTE_NODE''CDATA_SECTION_NODE''COMMENT_NODE''DOCUMENT_FRAGMENT_NODE'

'DOCUMENT_NODE''DOCUMENT_TYPE_NODE''ELEMENT_NODE''ENTITY_NODE''ENTITY_REFERENCE_NODE'

'NOTATION_NODE''PROCESSING_INSTRUCTION_NODE''TEXT_NODE'

*getElementsByTagName()可以根据名字来查找子elements；

*childNodes返回所有的子Nodes，其中所有的文本均为textNode，包含元素间的‘\n\r’和空格均为textNode；

*writexml() 时addindent=' '表示子元素的缩进，newl='\n'表示元素间的换行，encoding='utf-8'表示生成的xml的编码格式(<?xml version="1.0" encoding="utf-8"?>)。

参考：

完

譃七唯

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫