xml文件:
1.扩展的标记语言,是一种用于标记电子文件使这个文件具有结构化化的标记语言
解析xml的三种方法:
sax:是一种基于时间驱动的API,
包含两个部分:
解析器:负责读取xml文件,并向时间处理器发送相应的处理事件,处理事件包括:元素开始事件和元素结束事件
事件处理器:对相应的事件做出响应,对数据做出处理
自定义的事件处理器,需要继承ContentHandler类
方法:
characters(content): 从行开始,到标签之前的字符串
从一个标签遇到下一个标签之前的字符串
从一个标签遇到行结束之前的字符串
注意:标签可以是开始标签,也可以是结束标签
startDocument():文档启动时调用
endDocument():解析器到文档结尾的时候调用
startElement(name,attrs):遇到xml开始标签时调用,name是标签的名字,attrs是标签的属性,
endElement(name):遇到xml结束标签时调用
2.DOM:可以处理扩展置标记语言的标准编程接口
特点:
一个dom的解析器在解析一个xml文档的时候,一次性读取整个文档,把文档中的所有元素保存在内存中的一个树结构里面,可以利用dom提供不同函数来读取或修改文档的内容和结构,也可以把修改过的内容写入到xml文件中
3.Elementtree:将xml数据在内存中解析成树