1、若xml中出现中文字段
可以将文件的读取方式修改为GBK_2312编码
2、若xml中出现特殊字符,导致文件无法读取报错
xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 52, column 16
例如:在xml中存在L(B*W)=DN但是python打开后出现乱码
这种情况可以先打开xml文件,其中metaxml是xml的路径字段
xml_file = open(metaxml, ‘r’)
然后dom = xml.dom.minidom.parse(xml_file)
root = dom.documentElement
就可以打开xml文件并可以读取xml的相关节点
3、若xml修改后格式变化
在获得想要的节点后,修改节点标签名称,然后设置xml保存的编码方式和格式属性,确保读入xml和写入后的xml文件格式保持不变
import xml.etree.ElementTree as ET
tree = ET.parse(x_path)
root = tree.getroot()
for node in root.iter('Ground_Metadata'):
# 修改节点名称
node.tag = 'X5_Metadata'
tree.write(x_path,encoding='UTF-8', xml_declaration=True)