总结一下自己学习minidom模块的过程:
1 简要了解一下xml文档:
- DOM是 Document Object Model的简称,它以对象树来表示一个XML文档,使用它的好处是你可以非常灵活的遍历xml文档对象
- xml文档是由树状元素组成,有一个唯一的根元素,也叫文档元素。其他的元素和内容都包含在根元素中
- 元素:
--元素就是标记,元素与元素之间可以有文本,元素的内容也是文本
--元素是节点的一种,但不是叶子节点,元素下面有子节点
--每个节点有nodeName,nodeValue, nodeType属性, nodeValue 是节点的值,只对textNode有效
--叶子节点,如文本节点,下面不再有子节点
--两个节点之间的内容被视为文本节点
2 xml文档的读取
-生成dom对象:
>>>from xml.dom.minidom import parse, parseString #导入parse, parseString function
>>>dom1 = parse("D:\xmlpath.xml") #parse解析XML文档生成dom 对象
>>>dom2 = parseString("<tc> #parseString解析xml字符串生成dom对象
<prod>Adv</prod>
<version>14</version>
</tc>")
- 读取文档元素对象(根节点:tc)
>>>root1 = dom1.documentElement
>>>root2 = dom2.documentElement
-读取节点属性
>>>root1.nodeName
u'tc'
-子元素、子节点的访问
--使用getElementsByTagName方法: 可以搜索已知元素名的所有子元素
>>>verNum = dom.getElementsByTagName("version")
>>>print verNum
[<DOM Element: verNum at 0x10a5ee6c8>]