python-xml 模块-代码生成xml 文档

一、XML 模块

  1. 什么是xml:可扩展的标记语言,标记翻译为标签,用标签来组织数据的语言,也是一种语言可以用来自定义文档结构。相比json 使用场景更加广泛,但是语法格式相比json 复杂很多

  2. 什么时候使用json:前后台交互数据时使用json

  3. 什么时候使用xml:当需要自定义文档结构时使用xml,比如java中经常用xml来作为配置文件,常见操作就是通过程序去读取配置信息,而修改增加删除,一般是交给用户来手动完成

  4. 标签的叫发:node(节点)、elment(元素)、tag(标签)

    需求从conuntrys中获取所有的国家名称

    ==========================>countrys
    <data>
        <country name="Liechtenstein">
            <rank updated="yes">2</rank>
            <year>2009</year>
            <gdppc>141100</gdppc>
            <neighbor direction="E" name="Austria" />
            <neighbor direction="W" name="Switzerland" />
        </country>
        <country name="Singapore">
            <rank updated="yes">5</rank>
            <year>2012</year>
            <gdppc>59900</gdppc>
            <neighbor direction="N" name="Malaysia" />
        </country>
        <country name="Panama">
            <rank updated="yes">69</rank>
            <year>2012</year>
            <gdppc>13600</gdppc>
            <neighbor direction="W" name="Costa Rica" />
            <neighbor direction="E" name="Colombia" />
        </country>
    </data>
    
    # 取别名可以用于简化书写
    import xml.etree.ElementTree as ET
    tree = ET.parse('countrys')
    #获取根标签
    
    #第一种获取标签的方式
    #全文查找
    iter() 
    # 获取迭代器 如果不指定参数 则迭代器迭代的是所有标签
    print(root.iter())
    # 获取迭代器 如果指定参数 则迭代器迭代的是所有名称匹配的标签
    for e in root.iter("rank"):
        print(e)
     
    #第二种获取标签的方式
    #在当前标签下(所有子级标签)寻找第一个名称匹配的标签
    print(root.find("rank")) #第一个名称不匹配所以返回None
    
    #第三种获取标签的方式
    #在当前标签下(所有子级标签)寻找所有名称匹配的标签
    print(root.findall("rank")) #[]
    

    练习:找到新加坡中year 这个标签

    #print(e.tag) #标签名称
    #print(e.attrib) #属性 字典类型
    #print(e.text) #文本内容
    
    import xml.etree.ElementTree as ET
    
    tree = ET.parse("countrys")
    # 获取根标签
    root = tree.getroot()
    for e in root.iter("country"):
        if e.attrib["name"] == "Singapore":
            y = e.find("year")
            print(y.text) #2012
    

    在程序中修改文档内容:把所有year标签的文本加1

    import xml.etree.ElementTree as ET
    
    tree = ET.parse("countrys")
    root = tree.getroot()
    for e in root.iter("year"):
        e.text = str(int(e.text) + 1)
        
    #做完修改后要将修改后的内容写入文件
    tree.write('countrys')
    

    把新加坡国家删除:

    import xml.etree.ElementTree as ET
    
    tree = ET.parse("countrys")
    root = tree.getroot()
    
    for e in root.findall("country"):
        print(e)
        if e.attrib["name"] == "Singapore":
            #删除时要通过被删除的父级标签来删除
            root.remove(e)
    
    tree.write('countrys')
    

    用程序将中国信息写入文档中:

    import xml.etree.ElementTree as ET
    
    tree = ET.parse("countrys")
    root = tree.getroot()
    #添加时也需要将要添加的数据做成一个Element
    c = ET.Element("country",{"name":"china"})
    
    # 在国家下有一堆子标签
    ranke = ET.Element("ranke",{"updated":"yes"})
    c.append(ranke)
    
    year = ET.Element("year")
    year.text = "2018"
    c.append(year)
    
    #添加到root标签中
    root.append(c)
    tree.write("countrys")
    

    总结:一般不会通过程序 去修改 删除 和添加

    什么时候应该使用XML格式:

    当你需要自定文档结构时(XML最强大的地方就是结构)

    前后台交互不应该使用,前后台交互应该使用JSON格式

代码生成XML文档
import xml.etree.ElementTree as ET

# 创建根标签
root = ET.Element("root")
root.text = "这是一个XML文档!"

c = ET.Element("country",{"name":"china"})
root.append(c)

tree = ET.ElementTree(root)
# 参数: 文件名称 编码方式 是否需要文档声明
tree.write("new.xml",encoding="utf-8",xml_declaration=True)

=========================>new.xml 内容为
<?xml version='1.0' encoding='utf-8'?>
<root>这是一个XML文档!<country name="china" /></root>
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值