python使用ElementTree解析XML文件

最新推荐文章于 2022-08-21 15:42:31 发布

sinat_36796332

最新推荐文章于 2022-08-21 15:42:31 发布

阅读量876

点赞数 1

分类专栏： python 文章标签： python xml

本文链接：https://blog.csdn.net/sinat_36796332/article/details/69389701

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

将XML网页保存到本地
要加载XML文件，首先应该将网页上的信息提取出来，保存为本地XML文件。抓取网页信息可以使用python的urllib模块。方法是：先将网页打开，并都去上面的内容，然后在本地创建文件来，以写模式打开该文件，将网页信息写入文件中，保存在本地。代码如下：

    from urllib import urlopen
    url = "http://********/**"
    resp = urlopen(url).read()
    f = open('文件保存路径', 'w')
    f.write(resp)
    f.close()

解析XML文件
python有许多可以用来解析XML文件的函数，在这里介绍ElementTree(简称ET).它提供了轻量级的python式的API。实现逻辑简单，解析效率高。利用ET解析XML文件的方法是：先找出父级标签，然后再一级一级循环找出所需要的子标签。代码入下：

    import xml.etree.cElementTree as ET
    tree = ET.parse("***.xml")  #加载xml文件
    root = tree.getroot()  #得到第二级标签
    for child_of_root in root[1]:#root[1]为第二级标签中的第二个子标签 
        for child1 in child_of_root[7]: #原理同上
            for child2 in child1:
                print child2.tag, child2.attrib, child2.text
        for child3 in child_of_root[8]:
            for child4 in child3:
                print child4.tag, child4.attrib, child4.text