本文章仅做本人学习记录使用。
一、xml介绍
可扩展标记语言,标准通用标记语言的子集,简称XML。是一种用于标记电子文件使其具有结构性的标记语言。
二、简单实例
<!--它定义 XML 的版本(1.0)和所使用的编码(UTF-8 : 万国码, 可显示各种语言)。-->
<?xml version="1.0" encoding="UTF-8"?>
<!--根元素 文档必须包含根元素 并扩展到树的最底端-->
<note>
<!--根的 5 个子元素-->
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
<!--属性提供有关元素的额外信息-->
<img src="computer.gif">图片</img>
</note>
三、python解析
Python 有多种xml解析方法。此处以dom为例
以上面的xml文件为例使用dom读取xml。
#读取xml
import xml
DOMTree = xml.dom.minidom.parse("other\shiyanfenlei.xml")
booklist = DOMTree.documentElement
#获取指定名称节点列表
books=booklist.getElementsByTagName('from')
for book in books:
#判断节点是否包含指定属性
if book.hasAttribute("id"):
#输出属性值
print( book.getAttribute('id') )
#输出节点内容 childNodes 属性返回包含被选节点的子节点的 NodeList。
print( book.childNodes[0].data )