Java XML API 漫谈

转载 2004年10月27日 11:45:00

作者:robbin (MSN:robbin_fan AT hotmail DOT com)

在IBM的developerWorks上有两篇非常优秀的关于Java XML API的评测文章:

Java中XML文档模型的性能

Java中XML文档模型的用法

对这两篇文章我想说的就是 吐血推荐

Java的XML API这几篇文章该讲的都讲到了,我只想补充几点:

一、Crimson和Xerces恩仇录

Crimson来自于Sun捐赠给Apache的ProjectX项目,Xerces来自IBM捐赠给Apache的XML4J项目,结果Xerces胜出,成了Apache XML小组全力开发的XML API,而Crimon已经早就不做了,如今Xerces名满天下,到处都是在用Xerces DOM和SAX解析器,只有Sun不服气,非要在JDK1.4里面使用过时的Crimson,让人感觉像是在赌气一样,真是让人可怜又可气!不过IBM发行JDK用的XML 解析器自然是Xerces。

由于JDK的Class Loader的优先级关系,当你采用JAXP编写XML程序的时候,即使把Xerces包引入CLASSPATH,JDK还是会顽固的使用Crimson,这一点通过打开JVM的verbose参数可以观察到。不过JDK也允许你采用其它的解析器,因此我们可以通过在JRE/lib/目录下建一个jaxp.properties的文件,来替换解析器,jaxp.properties内容如下:

javax.xml.parsers.DocumentBuilderFactory=org.apache.xerces.jaxp.DocumentBuilderFactoryImpl

javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl

这样就可以使用Xerces,当然你必须还是要把Xerces包放到CLASSPATH下。

二、JAXP的姗姗来迟

Sun在XML领域总是后知后觉,等到Sun重视XML的时候,XML的API早就满天 飞了,尤其是IBM具有非常大的领先优势。不过Sun是规范的制订者,于是参考W3C的标准制订了JAXP规范。JAXP不像Xerces和Crimon那样,它只是一个spec,本身是不做任何事情的,它的作用就是提出一个统一的接口,让其它的XML API都来遵循JAXP编程,那么用JAXP写出来的程序,底层的API可以任意切换。

具体来说JAXP包括了几个工厂类,这就是JDK1.4里面的javax.xml.parsers 包,用来寻找符合DOM标准的XML API实现类的位置;此外JAXP还包括一整套interface,这就是JDK1.4里面的org.w3c.dom那几个包。工厂类负责加载DOM的实现类。那么加载的规则是什么呢?

我是通过阅读JAXP的源代码知道的,工厂类首先会根据java命令行传入的参数进行寻找,然后在根据JRE/lib/jaxp.properties中定义的实现类寻找,最后什么都找不到的话,就用Crimson。注意Crimons是由Bootstrap Class Loader来load的,如果你不通过上面两个方法来改变工厂的寻找顺序,那么铁定用Crimson了 :(

三、DOM解析器和DOM API

当你严格采用JAXP编程的时候,是遵循W3C的DOm标准的,那么在JAXP底层你实际上可以任意切换不同的DOM实现,例如Xerces,或者Crimon,再或者其它,切换方法就是配置jaxp.properties。因此JAXP就是一些标准接口而已。

而Xerces和Crimon也不单单是一个DOM实现那么简单,他们本身实际上也包含SAX解析器和DOM解析器。所以一个JAXP程序下面有如下层次:

JAXP应用程序 -> JAXP接口 -> Xerces DOM实现 -> Xerces DOM/SAX 解析器

只要你用JAXP编程,那么你就可以切换到Crimson上来

JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Crimson DOM/SAX 解析器

另外你也可以这样来做:

JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Xerces DOM/SAX 解析器

不过如果你的程序不安装JAXP来写,那么就没有办法切换不同的DOM实现了。

四、不是标准的dom4j和jdom

W3C的DOM标准API难用的让人想撞墙,于是有一帮人开发Java专用的XML API目的是为了便于使用,这就是jdom的由来,开发到一半的时候,另一部分人又分了出来,他们有自己的想法,于是他们就去开发dom4j,形成了今天这样两个API,至于他们之间的性能,功能之比较看看上面我推荐的文章就知道了,jdom全面惨败。

jdom 相当于上面的 JAXP接口 + Xerces DOM实现部分,它本身没有解析器,它可以使用Xerces或者Crimson的解析器,就是这样:

jdom应用程序 -> jdom API -> Xerces/Crimson解析器

dom4j 和jdom类似,不过他自己绑定了一个叫做Alfred2的解析器,功能不是很全,但是速度很快,当没有其它的解析器的时候,dom4j将使用Alfred2解析器,如下:

dom4j应用程序 -> dom4j API ->  Xerces/Crimson解析器

或者

dom4j应用程序 -> dom4j API ->  Alfred2解析器

你在SF上下载的dom4j.jar是不含 Alfred2解析器的,而dom4j-full.jar包含了 Alfred2解析器,在这种情况下,实际上你什么也不需要,光是一个dom4j-full.jar就全部都包括了。

因此可以看出采用dom4j/jdom编写的应用程序,已经不具备可移植性了。

五、小插曲

Sun是JAXP标准的制订者,甚至很执著的在JDK1.4里面绑定Crimson DOM实现和解析器,然后可笑的是,Sun自己的JAXM RI竟然不是用JAXP写出来的,而是dom4j,制订标准让大家遵守,自己却监守自盗,这未免太说不过去了吧!

BTW: Hibernate也用的是dom4j来读取XML配置文件,如今已经越来越多的程序纷纷采用dom4j,如果你不是那么在乎可移植性,我强烈建议你采用dom4j。


java xml api 简单使用例子

java xml api 简单使用例子 主要步骤: 1、创建 DocumentBuilderFactory 对象 2、读取文档,得到文档对象 Document 3、解析xml元素,比如 doc...
  • wbxx727124
  • wbxx727124
  • 2016年02月21日 21:03
  • 970

用Java自带API解析XML字符串和生成XML字符串的例子

Parse XML String and create XML String Sample Using Java DOM API package g002.javaxmltest; imp...
  • zgkli6com
  • zgkli6com
  • 2014年01月19日 14:12
  • 1059

《.NET 4.0面向对象编程漫谈》读者请进

《.NET 4.0面向对象编程漫谈》门户网页 汇总相关资源
  • bitfan
  • bitfan
  • 2010年11月06日 14:38
  • 20975

Java&Xml教程(一)简介

XML是广泛用于数据传输和存储的技术。Java语言提供个各种各样的API来解析XML,例如DOM、SAX、StAX、JAXB。也还有一些其他的API用于解析XML,例如JDOM。本教程的目的是探索使用...
  • Rongbo_J
  • Rongbo_J
  • 2015年12月07日 20:33
  • 1572

漫谈递归:递归的思想

为什么要用递归 编程里面估计最让人摸不着头脑的基本算法就是递归了。很多时候我们看明白一个复杂的递归都有点费时间,尤其对模型所描述的问题概念不清的时候,想要自己设计一个递归那么就更是有难度了。 ...
  • chencheng126
  • chencheng126
  • 2014年10月23日 21:43
  • 672

JAXP(Java API for XMLProcessing)知识总结

XML的解析1.xml解析方式 DOM方式:Document Object Model,文档对象模型,W3C推荐的使用方式。 SAX方式:Simple API for XML,不是官方标准,但是属...
  • yeyinglingfeng
  • yeyinglingfeng
  • 2015年08月07日 11:29
  • 322

java用Digester解析xml文件——高效率的xml解析

Digester不是jdk里面自带的,有依赖包
  • qq525099302
  • qq525099302
  • 2014年05月02日 21:23
  • 154137

《C++0x漫谈》系列

05年开始关注C++0x,其时C++0x的大部分草案其实都已经初具雏形。但几个重大的特性:concepts, rvalue, memory-model, variadic-templates等都还在激...
  • pongba
  • pongba
  • 2007年04月11日 20:33
  • 13364

前端性能优化漫谈----用户

前端性能优化的方式方法很多,个人而言将其分为两部分: 1. 其一是如何让用户更快的看见 (用户篇) 2. 其二是如何让代码更好的维护 (后续的 代码篇) 用户篇我们主要解决用户输入地址按下...
  • stopllL
  • stopllL
  • 2017年09月13日 16:03
  • 135

JAXB(Java API for XML Binding)注解

@XmlRootElement   将一个Java类映射为一段XML的根节点 参数:name          定义这个根节点的名称       namespace    定义这个根节点命名空间 ...
  • yelove1990
  • yelove1990
  • 2015年01月22日 17:26
  • 792
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java XML API 漫谈
举报原因:
原因补充:

(最多只允许输入30个字)