python 处理xml 笔记

最新推荐文章于 2024-08-01 09:25:57 发布

l4kangaxx

最新推荐文章于 2024-08-01 09:25:57 发布

阅读量743

点赞数

分类专栏：框架开发文章标签： xml

本文链接：https://blog.csdn.net/lion_kangaxx/article/details/19554201

版权

框架开发专栏收录该内容

4 篇文章 0 订阅

订阅专栏

新近学习python ，其对xml文档的处理方式颇有特色，当然这是由于其xml库导致的。今天在这里略做记录。

首先简单贴出一个xml文档内容

<?xml version="1.0"?>
<config name = 'gxx' ver = '1.0'>
    <client ip= '192.168.1.61'>
	<name>qfzy001</name>
    </client>
    <client ip = '192.168.1.62'>
	<name>qfzy002</name>
    </client>
 </config>

假设这个文档路径是 /home/document/clientlist.xml

那么我们需要先引用xml文件

from xml.etree import ElementTree
tree = Element.parse(r'/home/document/clientlist.xml')
root = tree.getroot()

当然也可以写成

import xml.etree.ElementTree as ET
tree = ET.parse(r'/home/document/clientlist.xml')
root = tree.root

有区别么？没区别么？

以上的内容是从文件中导入，如果查看xml的帮助文档的话，也有从string中导入的方法，前提是你得另外写代码来读取文档

root = ET.fromstring(country_data_as_string)

读入文档后我们可以看看如何获取root的一些信息

print root.tag,root.attrib

这里的结果是 config {'ver': '1.0', 'name': 'gxx'} ， config就是其tag， attrib就是在当前级别的内部参数

在xml中数据的保存格式有两种方式

<client ip = '192.168.1.61'> </client>

或者

<client>
    <name> qfzy001 </name>
</client>

这里不讨论xml的格式问题，我们只需要知道python的xml库是如何获取不同格式的数据即可

现在来看看，如果直接获取config从属的各个元素数据的方法

for child in root:
   print child.get('ip')

第二种区别也不大

for child in root:
   print child.find('name').text

如果我们想要获取指定名称的直接的从属元素（direct element），那就使用findall(‘名字'),如果使用find('名字')，那么只获得第一个符合要求的元素

for clients in root.findall('client'):
   print clients.get('ip')

如果符合元素名称的查询无结果则返回空

如果我们希望遍历某个节点位root的整颗树的话，那就可以使用iter，我在python2.6下直接使用iter报错回头查查看，现在先把python3.3的代码贴出

for names in root.iter('name'):
    print (names.text) #注意python 3的print命令必须要用括号包含打印出的信息

好了，基本的xml操作这些就够了，至于如果需要操作一棵很深的树需要多少代码，无非是对以上的内容就行应用而已，这里就不多说了，最后给出一个简单的生产XML的代码：

import xml.etree.ElementTree as ET
a = ET.Element('a')
b = ET.SubElement(a,'b')
c = ET.SubElement(a,'c')
d = ET.SubElement(b,'d)
ET.dump(a)

怎么样，很简单把？

l4kangaxx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录