Python：Dom解析XML文件(读XML)

最新推荐文章于 2024-09-15 22:31:42 发布

weixin_33788244

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量57

点赞数

文章标签： python

原文链接：http://blog.51cto.com/allanx/1148276

版权

这一篇文章接着前一篇来接续讲解如何使用Dom方式操作XML数据，这一篇文章主要介绍如何解析（parse）XML文件，本文实例XML文件是上一篇的生成的文件，我们看看能不能完整的读出来，这个XML文件内容如下：

XML/HTML代码

<?xml version="1.0" encoding="utf-8"?>
<book_store name="new hua" website="http://www.ourunix.org">
<book>
<name>Hamlet</name>
<author>William Shakespeare</author>
<price>$20</price>
<grade>good</grade>
</book>
<book>
<name>shuihu</name>
<author>naian shi</author>
<price>$200</price>
<grade>good</grade>
</book>
</book_store>

主要方法

1、加载读取XML文件

Python代码

minidom.parse(filename)

2、获取XML文档对象

Python代码

doc.documentElement

3、获取XML节点属性值

Python代码

node.getAttribute(AttributeName)

4、获取XML节点对象集合

Python代码

node.getElementsByTagName(TagName)

5、获取XML节点值

Python代码

node.childNodes[index].nodeValue

代码演示

同样先用一个简单版本来演示下如何使用Dom解析XML文件，代码如下：

Python代码

'''''
Created on 2012-8-28
@author: walfred
@module: domxml.parseXMLSimple
@description:
'''
import xml.dom.minidom as Dom
import sys
if __name__ == "__main__":
try:
xml_file = Dom.parse("./book_store.xml")
except Exception, e:
print e
sys.exit()
node_root = xml_file.documentElement
name = node_root.getAttribute("name")
website = node_root.getAttribute("website")
print "name of book store: %s\nwebsite of book store: %s" %(name, website)
node_book_list = node_root.getElementsByTagName("book")
for book_node in node_book_list:
book_name_node = book_node.getElementsByTagName("name")[0]
book_name_value = book_name_node.childNodes[0].data
book_author_node = book_node.getElementsByTagName("author")[0]
book_author_value = book_author_node.childNodes[0].data
book_price_node = book_node.getElementsByTagName("price")[0]
book_price_value = book_price_node.childNodes[0].data
book_grade_node = book_node.getElementsByTagName("grade")[0]
book_grade_value = book_grade_node.childNodes[0].data
print "book: %s\t author: %s\t price: %s\t grade: %s\t" %(book_name_value, book_author_value, book_price_value, book_grade_value)

运行结果如下：

name of book store: new hua

website of book store: http://www.ourunix.org

book: Hamlet author: William Shakespeare price: $20 grade: good

book: shuihu author: naian shi price: $200 grade: good

同样接着来一个所谓的高级版本：

XML/HTML代码