ATTN:dom:(DocumentObject Model,文档对象模型)是W3C组织的推荐的处理XML的一种方式,dom是真正的国际标准
sax:(Simple API for XML) 不是官方标准,是事实的标准,几乎所有的 XML 解析器都支持它。他不由任何商业组织维护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响他在xml解析领域的地位。
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。他的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
sax的实现方法和dom不同。他只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。他的缺点就是写,有些资料介绍了写入的方法,但是我感觉这对本例没有必要。后面主要讲解用sax2.0实现xml文档解析。
xml文档进行解析的 DOM 或 SAX 的解析器对象。
DocumentBuilder的对象是dom解析器,通过对应的工厂类创建
SAXParser的对象是sax解析器,通过对应的工厂类创建。
javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。
调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。
DocumentBuilderFactoryfactory= DocumentBuilderFactory.newInstance();
调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。
DocumentBuilderdb=factory.newDocumentBuilder();
调用 DOM 解析器对象的parse() 方法解析 XML 文档,得到代表整个文档的Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。通过parse()装载一个xml文档。
xml文档里面所有的内容都会被当成Node类型来处理
element元素节点、test文本节点、attr属性节点、
node界定啊类型定义了作为节点的共性。getNodeName()、getNodeType()getNodeValue()