新近学习python , 其对xml文档的处理方式颇有特色,当然这是由于其xml库导致的。今天在这里略做记录。
首先简单贴出一个xml文档内容
<?xml version="1.0"?>
<config name = 'gxx' ver = '1.0'>
<client ip= '192.168.1.61'>
<name>qfzy001</name>
</client>
<client ip = '192.168.1.62'>
<name>qfzy002</name>
</client>
</config>
假设这个文档路径是 /home/document/clientlist.xml
那么我们需要先引用xml文件
from xml.etree import ElementTree
tree = Element.parse(r'/home/document/clientlist.xml')
root = tree.getroot()
当然也可以写成
import xml.etree.ElementTree as ET
tree = ET.parse(r'/home/document/clientlist.xml')
root = tree.root
有区别么?没区别么?
以上的内容是从文件中导入,如果查看xml的帮助文档的话,也有从string中导入的方法,前提是你得另外写代码来读取文档
root = ET.fromstring(country_data_as_string)
读入文档后我们可以看看如何获取root的一些信息
print root.tag,root.attrib
这里的结果是 config {'ver': '1.0', 'name': 'gxx'} , config就是其tag, attrib就是在当前级别的内部参数
在xml中数据的保存格式有两种方式
<client ip = '192.168.1.61'> </client>
或者
<client>
<name> qfzy001 </name>
</client>
这里不讨论xml的格式问题,我们只需要知道python的xml库是如何获取不同格式的数据即可
现在来看看,如果直接获取config从属的各个元素数据的方法
for child in root:
print child.get('ip')
第二种区别也不大
for child in root:
print child.find('name').text
如果我们想要获取指定名称的直接的从属元素 (direct element),那就使用findall(‘名字'),如果使用find('名字'),那么只获得第一个符合要求的元素
for clients in root.findall('client'):
print clients.get('ip')
如果符合元素名称的查询无结果则返回空
如果我们希望遍历某个节点位root的整颗树的话,那就可以使用iter,我在python2.6下直接使用iter报错回头查查看,现在先把python3.3的代码贴出
for names in root.iter('name'):
print (names.text) #注意python 3的print命令必须要用括号包含打印出的信息
好了,基本的xml操作这些就够了,至于如果需要操作一棵很深的树需要多少代码,无非是对以上的内容就行应用而已,这里就不多说了,最后给出一个简单的生产XML的代码:
import xml.etree.ElementTree as ET
a = ET.Element('a')
b = ET.SubElement(a,'b')
c = ET.SubElement(a,'c')
d = ET.SubElement(b,'d)
ET.dump(a)
怎么样,很简单把?