本文实例讲述了python实现提取xml内容并保存到excel中的方法。分享给大家供大家参考,具体如下:
最近做一个项目是解析xml文件,提取其中的chatid和lt、timestamp等信息,存到excel里。
1.解析xml,提取数据
使用python自带的xml.dom中的minidom(也可以用lxml)
xml文件如下:
minidom.parse()#解析文件,返回dom对象
_get_documentelement()dom是树形结构,获得了树形结构的根节点
getelementsbytagname()根据name查找根目录下的子节点
getattribute()获取dom节点的属性的值
提取的代码如下:
class get_xml():
#加载获取xml的文档对象
def __init__(self,address):
#解析address文件,返回dom对象,address为文件地址
self.doc = minidom.parse(address)
#dom是树形结构,_get_documentelement()获得了树形结构的根节点
self.root = self.doc._get_documentelement()
#.getelementsbytagname(),根据