在python中解析XML文件也有Dom和Sax两种方式,这里先介绍如何是使用Dom解析XML,这一篇文章是Dom生成XML文件,下一篇文章再继续介绍Dom解析XML文件。

        在生成XML文件中,我们主要使用下面的方法来完成。

主要方法

        1、生成XML节点(node)

Python代码

  1. createElement("node_name") 

        2、给节点添加属性值(Attribute)

Python代码

  1. node.setAttribute("att_name", "arr_value") 

        3、节点的标签值(data)

Python代码

  1. createTextNode("node_value") 

        其中第1、3点在创建完节点(节点值)之后,还需使用下面的方法添加到指点的节点的位置下面:

Python代码

  1. prev_node.appendChild(cur_node) 

        这里的prev_node要添加节点的上一层节点,而cur_node即为当前要添加的节点了。

代码演示

        下面用代码来演示下如何使用Dom来生成XML,这个是简单版本,如下:

Python代码

  1. '''
  2. Created on 2012-8-28
  3. @author:  walfred
  4. @module: domxml.genXML
  5. @description:
  6. '''
  7. import xml.dom.minidom as Dom 
  8. if __name__ == "__main__": 
  9.     doc = Dom.Document() 
  10.     root_node = doc.createElement("book_store") 
  11.     root_node.setAttribute("name", "newhua") 
  12.     root_node.setAttribute("website", "http://www.ourunix.org") 
  13.     doc.appendChild(root_node) 
  14.     book_node = doc.createElement("book1") 
  15.     book_name_node = doc.createElement("name") 
  16.     book_name_value = doc.createTextNode("hamlet") 
  17.     book_name_node.appendChild(book_name_value) 
  18.     book_node.appendChild(book_name_node) 
  19.     book_author_node = doc.createElement("author") 
  20.     book_author_value = doc.createTextNode("William Shakespeare") 
  21.     book_author_node.appendChild(book_author_value) 
  22.     book_node.appendChild(book_author_node) 
  23.     root_node.appendChild(book_node) 
  24.     f = open("book_store.xml", "w") 
  25.     f.write(doc.toprettyxml(indent = "\t", newl = "\n", encoding = "utf-8")) 
  26.     f.close() 

        这个代码将在当前目录下生成一个book_store.xml文件,我把它也贴在下面:

XML/HTML代码

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <book_store name="newhua" website="http://www.ourunix.org">
  3. <book1>
  4. <name>hamlet</name>
  5. <author>William Shakespeare</author>
  6. </book1>
  7. </book_store>

        当然一旦你掌握了这些基本方法之后,我们可以用一个类来更好的完成,这个类我们称之为XMLGenerator,代码如下:

Python代码

  1. '''
  2. Created on 2012-8-28
  3. @author:  walfred
  4. @module: domxml.wXMLbyDom
  5. @description:
  6. '''
  7. import xml.dom.minidom as Dom 
  8. class XMLGenerator: 
  9. def __init__(self, xml_name): 
  10. self.doc = Dom.Document() 
  11. self.xml_name = xml_name 
  12. def createNode(self, node_name): 
  13. return self.doc.createElement(node_name) 
  14. def addNode(self, node, prev_node = None): 
  15.         cur_node = node 
  16. if prev_node is not None: 
  17.             prev_node.appendChild(cur_node) 
  18. else: 
  19. self.doc.appendChild(cur_node) 
  20. return cur_node 
  21. def setNodeAttr(self, node, att_name, value): 
  22.         cur_node = node 
  23.         cur_node.setAttribute(att_name, value) 
  24. def setNodeValue(self, cur_node, value): 
  25.         node_data = self.doc.createTextNode(value) 
  26.         cur_node.appendChild(node_data) 
  27. def genXml(self): 
  28.         f = open(self.xml_name, "w") 
  29.         f.write(self.doc.toprettyxml(indent = "\t", newl = "\n", encoding = "utf-8")) 
  30.         f.close() 
  31. if __name__ == "__main__": 
  32.     myXMLGenerator = XMLGenerator("book_store.xml") 
  33. #xml root node
  34.     node_book_store = myXMLGenerator.createNode("book_store") 
  35.     myXMLGenerator.setNodeAttr(node_book_store, "name", "new hua") 
  36.     myXMLGenerator.setNodeAttr(node_book_store, "website", "http://www.ourunix.org") 
  37.     myXMLGenerator.addNode(node = node_book_store) 
  38. #book01
  39.     node_book_01 = myXMLGenerator.createNode("book") 
  40.     node_book_01_name = myXMLGenerator.createNode("name") 
  41.     myXMLGenerator.setNodeValue(node_book_01_name, "Hamlet") 
  42.     myXMLGenerator.addNode(node_book_01_name, node_book_01) 
  43.     node_book_01_author = myXMLGenerator.createNode("author") 
  44.     myXMLGenerator.setNodeValue(node_book_01_author, "William Shakespeare") 
  45.     myXMLGenerator.addNode(node_book_01_author, node_book_01) 
  46.     node_book_01_price = myXMLGenerator.createNode("price") 
  47.     myXMLGenerator.setNodeValue(node_book_01_price, "$20") 
  48.     myXMLGenerator.addNode(node_book_01_price, node_book_01) 
  49.     node_book_01_grade = myXMLGenerator.createNode("grade") 
  50.     myXMLGenerator.setNodeValue(node_book_01_grade, "good") 
  51.     myXMLGenerator.addNode(node_book_01_grade, node_book_01) 
  52.     myXMLGenerator.addNode(node_book_01, node_book_store) 
  53. #book 02
  54.     node_book_02 = myXMLGenerator.createNode("book") 
  55.     node_book_02_name = myXMLGenerator.createNode("name") 
  56.     myXMLGenerator.setNodeValue(node_book_02_name, "shuihu") 
  57.     myXMLGenerator.addNode(node_book_02_name, node_book_02) 
  58.     node_book_02_author = myXMLGenerator.createNode("author") 
  59.     myXMLGenerator.setNodeValue(node_book_02_author, "naian shi") 
  60.     myXMLGenerator.addNode(node_book_02_author, node_book_02) 
  61.     node_book_02_price = myXMLGenerator.createNode("price") 
  62.     myXMLGenerator.setNodeValue(node_book_02_price, "$200") 
  63.     myXMLGenerator.addNode(node_book_02_price, node_book_02) 
  64.     node_book_02_grade = myXMLGenerator.createNode("grade") 
  65.     myXMLGenerator.setNodeValue(node_book_02_grade, "good") 
  66.     myXMLGenerator.addNode(node_book_02_grade, node_book_02) 
  67.     myXMLGenerator.addNode(node_book_02, node_book_store) 
  68. #gen
  69.     myXMLGenerator.genXml() 

        同样这个方法会在本目录下生成一个book_store.xml文件,如下:

XML/HTML代码

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <book_store name="new hua" website="http://www.ourunix.org">
  3. <book>
  4. <name>Hamlet</name>
  5. <author>William Shakespeare</author>
  6. <price>$20</price>
  7. <grade>good</grade>
  8. </book>
  9. <book>
  10. <name>shuihu</name>
  11. <author>naian shi</author>
  12. <price>$200</price>
  13. <grade>good</grade>
  14. </book>
  15. </book_store>

        这个版本算一个稍微高级的版本,但由于时间有限还很显得粗糙,读者可以发挥出更好的。