基本的解析方式有三种,一种叫SAX,一种叫DOM,DOM4J。
第一种SAX(Simple API for XML)
SAX处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。一般来说,SAX还比它的替代者DOM快许多。
SAX 处理涉及以下步骤:
1.创建一个事件处理程序。
2.创建 SAX 解析器。
3.向解析器分配事件处理程序。
4.解析文档,同时向事件处理程序发送每个事件。
第二种DOM(Document Object Model)
DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构,然后才能做任何工作。由于它是基于信息层次的,因而DOM被认为是基于树或基于对象的。
DOM 处理涉及以下步骤:
1、建立DocumentBuilderFactory 2、建立DocumentBuilder 3、解析xml文档 4、操作xml文档 5、建立TransformerFactory 6、建立Transformer 7、保存修改后的xml文档
第三种DOM4J (Document Object Model for Java)
DOM4J(Document Object Model for Java)DOM4J代表了完全独立的开发结果,但最初,它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项,它通过DOM4J API和标准DOM接口具有并行访问功能。
DOM4J 处理涉及以下步骤:
1、导入dom4j的jar包
2、指定要解析的XML文件
3、把XML文件转换成Document对象
4、获取节点属性或文本的值.指定要解析的文件
2、指定要解析的XML文件
3、把XML文件转换成Document对象
4、获取节点属性或文本的值.指定要解析的文件