json和pickle跳过,直接xml。
先看xml的数据类型:
<?xml version="1.0" encoding="UTF-8"?>
<note> #标签
<to>Tove</to> #闭合标签 还有自闭合标签
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
那么,这些数据可以封装成字典。
import xml.etree.ElementTree as ET
tree = ET.parse("xmltest.xml") #parse 解析的意思
root = tree.getroot()
print(root.tag) #拿到根节点标签名
#对根节点进行遍历操作
for i in root:
print(i.tag) #打印子对象标签名
for j in i:
print(j.tag) #子子标签名打印
print(j.attrib) #打印子标签的属性值,输出是字典形式
print(j.text) #打印子标签的内容
#遍历xml文档
for child in root:
print(child.tag, child.attrib)
for i in child:
print(i.tag,i.text)
#只遍历某个节点,比如year节点
for node in root.iter('year'): #iter 方法可以对子结点进行深度优先遍历,遍历所有的元素,然后检验有没有你想要的。
print(node.tag,node.txt)
#修改 删除
for node in root.iter('year'):
new_year = int(node.text) + 1 #修改值
node.text = str(new_year)
node.set("updated","yes") #修改属性值
tree.write("xmltest.xml") #写入全部数据,包括已经修改和没修改的
#删除排名标签大于50的
for country in root.finall('country'):
rank = int(country.find('rank').text)
if rank>50:
root.remove(country)
tree.write("deleteDone.xml")
#自己创建xml
import xml.etree.ElementTree as ET
new_xml = ET.Element("namelist") #创建了一个根节点标签namelist
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"}) #插入name标签,插入标签属性
age = ET.SubElement(new_xml,"age",attrib={"checked":"no"})
sex = ET.SubElement(new_xml,"sex")
sex.text = '33'
et = ET.ElementTree(new_xml) #生成文档树
et.write("test.xml",encoding="utf-8",xml_declaration=True)