JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。
JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念以及映射),把SAX和DOM的功能有效地结合起来。
在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。
JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处。
这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA程序员在使用时来用起来总觉得不太方便。
DOM 的缺点主要是来自于由于Dom是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的。JDOM的最新版本为JDOM Beta 9。最近JDOM被收录到JSR-102内,这标志着JDOM成为了JAVA平台组成的一部分。
二、JDOM 包概览
JDOM 是由以下几个包组成的
org.jdom 包含了所有的xml文档要素的java类
org.jdom.adapters 包含了与dom适配的java类
org.jdom.filter 包含了xml文档的过滤器类
org.jdom.input 包含了读取xml文档的类
org.jdom.output 包含了写入xml文档的类
org.jdom.transform 包含了将jdom xml文档接口转换为其他xml文档接口
org.jdom.xpath 包含了对xml文档xpath操作的类
三、JDOM 类说明
1 、org.JDOM这个包里的类是你解析xml文件后所要用到的所有数据类型。
Text
Attribute Attribute 定义了XML 的属性
CDATA CDATA 定义了XML CDATA 区域
CharacterData
CharacterData 是一个标识借口,标识基于字符的节
点。如CDATA, Comment, Text.
Comment Comment 定义了XML 注释的行为
Document 定义了XML 文档
DocumentType DocumentType 定义XML DOCTYPE 声明
Element Element 定义XML 元素
Node Node 为所有的dom4j中XML 节点定义了多态行为
Text Text 定义XML 文本节点 .
Namespace:命名空间
...
2 、org.JDOM.transform在涉及xslt格式转换时应使用下面的2个类
JDOMSource
JDOMResult
3 、org.JDOM.input输入类,一般用于文档的创建工作
SAXBuilder
DOMBuilder
ResultSetBuilder
4 、org.JDOM.output输出类,用于文档转换输出
XMLOutputter
SAXOutputter
DomOutputter
JTreeOutputter
以下如无特指均指JDOM里的Document。
四、JDOM主要使用方法
1.Ducument 类
(1)Document 的操作方法:
Element root = new Element("GREETING");
Document doc = new Document(root);
root.setText("Hello JDOM!");
或者简单的使用 Document doc = new Document(new Element("GREETING").setText("Hello JDOM!t"));
这点和DOM不同。Dom则需要更为复杂的代码,如下:
DocumentBuilderFactory factory =DocumentBuilderFactory.newInstance();
DocumentBuilder builder =factory.newDocumentBuilder();
Document doc = builder.newDocument();
Element root =doc.createElement("root");
Text text = doc.createText("This is the root");
root.appendChild(text);
doc.appendChild(root);
注意事项:JDOM不允许同一个节点同时被2个或多个文档相关联,要在第2个文档中使用原来老文档中的节点的话。首先需要使用detach()把这个节点分开来。
(2) 从文件、流、系统ID、URL得到Document对象:
DOMBuilder builder = new DOMBuilder();
Document doc = builder.build(new File("jdom_test.xml"));
SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(url);
在新版本中DOMBuilder 已经Deprecated掉 DOMBuilder.builder(url),用SAX效率会比较快。
这里举一个小例子,为了简单起见,使用String对象直接作为xml数据源:
public jdomTest() {
String textXml = null;
textXml = "";
textXml = textXml +"aaabbbcccddd";
textXml = textXml + "";
SAXBuilder builder = new SAXBuilder();
Document doc = null;
Reader in= new StringReader(textXml);
try {
doc = builder.build(in);
Element root = doc.getRootElement();
List ls = root.getChildren();// 注意此处取出的是root节点下面的一层的Element集合
for (Iterator iter = ls.iterator(); iter.hasNext(); ) {
Element el = (Element) iter.next();
if(el.getName().equals("to")){
System.out.println(el.getText());
}
}
}
catch (IOException ex) {
ex.printStackTrace();
}
catch (JDOMException ex) {
ex.printStackTrace();
}
}
(3)DOM 的document和JDOM的Document之间的相互转换使用方法
DOMBuilder builder = new DOMBuilder();
org.jdom.Document jdomDocument = builder.build(domDocument);
DOMOutputter converter = new DOMOutputter();// work with the JDOM document …
org.w3c.dom.Document domDocument = converter.output(jdomDocument);
// work with the DOM document …
2.XML 文档输出
XMLOutPutter 类:
JDOM 的输出非常灵活,支持很多种io格式以及风格的输出
Document doc = new Document(...);
XMLOutputter utp = new XMLOutputter();
outp.output(doc, fileOutputStream); // Raw output
outp.setTextTrim(true); // Compressed output
outp.output(doc, socket.getOutputStream());
outp.setIndent(" ");// Pretty output
outp.setNewlines(true);
outp.output(doc, System.out);
详细请参阅最新的JDOM API手册
3.Element 类:
(1) 浏览Element树
Element root = doc.getRootElement();// 获得根元素 element
List allChildren = root.getChildren();// 获得所有子元素的一个 list
List namedChildren = root.getChildren("name");// 获得指定名称子元素的 list
Element child = root.getChild("name");//获得指定名称的第一个子元素
JDOM 给了我们很多很灵活的使用方法来管理子元素(这里的List是java.util.List)
List allChildren = root.getChildren();
allChildren.remove(3); // 删除第四个子元素
allChildren.removeAll(root.getChildren("jack"));// 删除叫“jack”的子元素
root.removeChildren("jack"); // 便捷写法
allChildren.add(new Element("jane"));// 加入
root.addContent(new Element("jane")); // 便捷写法
allChildren.add(0, new Element("first"));
(2) 移动 Elements:
在JDOM里很简单
Element movable = new Element("movable");
parent1.addContent(movable); // place
parent1.removeContent(movable); // remove
parent2.addContent(movable); // add
在Dom里
Element movable = doc1.createElement("movable");
parent1.appendChild(movable); // place
parent1.removeChild(movable); // remove
parent2.appendChild(movable); // 出错 !
补充:纠错性
JDOM 的Element构造函数(以及它的其他函数)会检查element是否合法。
而它的add/remove方法会检查树结构,检查内容如下:
1. 在任何树中是否有回环节点
2. 是否只有一个根节点
3. 是否有一致的命名空间(Namespaces)
(3)Element 的text内容读取
A cool demo
// The text is directly available
// Returns "\n A cool demo\n"
String desc = element.getText();
// Returns "A cool demo"
String desc = element.getTextTrim();
(4)Elment 内容修改
element.setText("A new description");
3. 可正确解释特殊字符
element.setText(" content");
4.CDATA 的数据写入、读出
element.addContent(new CDATA(" content"));
String noDifference = element.getText();
混合内容
element 可能包含很多种内容,比如说
取table的子元素 tr
String text = table.getTextTrim();
Element tr = table.getChild("tr");
也可使用另外一个比较简单的方法
List mixedCo = table.getContent();
Iterator itr = mixedCo.iterator();
while (itr.hasNext()) {
Object o = i.next();
if (o instanceof Comment) {...}
// 这里可以写成Comment, Element, Text, CDATA,ProcessingInstruction, 或者是EntityRef的类型
}
// 现在移除Comment,注意这里游标应为1。这是由于回车键也被解析成Text类的缘故,所以Comment项应为1。
mixedCo.remove(1);
4.Attribute 类
String width = table.getAttributeValue("width");// 获得 attribute
int border = table.getAttribute("width").getIntValue();
table.setAttribute("vspace", "0");//设置 attribute
table.removeAttribute("vspace");// 删除一个或全部 attribute
table.getAttributes().clear();
5.处理指令(Processing Instructions)操作
一个Pls的例子
<?br ?>
<?cocoon-process type="xslt"?>
| |
| |
目标 数据
处理目标名称 (Target)
String target = pi.getTarget();
获得所有数据(data),在目标(target)以后的所有数据都会被返回。
String data = pi.getData();
String type = pi.getValue("type"); 获得指定属性的数据
List ls = pi.getNames(); 获得所有属性的名称
6. 命名空间操作
xmlns:xhtml="http://www.w3.org/1999/xhtml">
Home Page
Namespace xhtml = Namespace.getNamespace("xhtml", "http://www.w3.org/1999/xhtml");
List kids = html.getChildren("title", xhtml);
Element kid = html.getChild("title", xhtml);
kid.addContent(new Element("table", xhtml));
7.XSLT(XSLT 是一种基于XML的语言,用于将一类(class)XML文档转换成另一种XML文档。)格式转换
使用以下函数可对XSLT转换
最后如果你需要使用w3c的Document则需要转换一下。
public static Document transform(String stylesheet , Document in)
throws JDOMException {
try {
Transformer transformer = TransformerFactory.newInstance()
.newTransformer(new StreamSource(stylesheet));
JDOMResult ut = new JDOMResult();
transformer.transform(new JDOMSource(in), out);
return out.getDeocument();
}
catch (TransformerException e) {
throw new JDOMException("XSLT Trandformation failed", e);
}
}
JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念以及映射),把SAX和DOM的功能有效地结合起来。
在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。
JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处。
这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA程序员在使用时来用起来总觉得不太方便。
DOM 的缺点主要是来自于由于Dom是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的。JDOM的最新版本为JDOM Beta 9。最近JDOM被收录到JSR-102内,这标志着JDOM成为了JAVA平台组成的一部分。
二、JDOM 包概览
JDOM 是由以下几个包组成的
org.jdom 包含了所有的xml文档要素的java类
org.jdom.adapters 包含了与dom适配的java类
org.jdom.filter 包含了xml文档的过滤器类
org.jdom.input 包含了读取xml文档的类
org.jdom.output 包含了写入xml文档的类
org.jdom.transform 包含了将jdom xml文档接口转换为其他xml文档接口
org.jdom.xpath 包含了对xml文档xpath操作的类
三、JDOM 类说明
1 、org.JDOM这个包里的类是你解析xml文件后所要用到的所有数据类型。
Text
Attribute Attribute 定义了XML 的属性
CDATA CDATA 定义了XML CDATA 区域
CharacterData
CharacterData 是一个标识借口,标识基于字符的节
点。如CDATA, Comment, Text.
Comment Comment 定义了XML 注释的行为
Document 定义了XML 文档
DocumentType DocumentType 定义XML DOCTYPE 声明
Element Element 定义XML 元素
Node Node 为所有的dom4j中XML 节点定义了多态行为
Text Text 定义XML 文本节点 .
Namespace:命名空间
...
2 、org.JDOM.transform在涉及xslt格式转换时应使用下面的2个类
JDOMSource
JDOMResult
3 、org.JDOM.input输入类,一般用于文档的创建工作
SAXBuilder
DOMBuilder
ResultSetBuilder
4 、org.JDOM.output输出类,用于文档转换输出
XMLOutputter
SAXOutputter
DomOutputter
JTreeOutputter
以下如无特指均指JDOM里的Document。
四、JDOM主要使用方法
1.Ducument 类
(1)Document 的操作方法:
Element root = new Element("GREETING");
Document doc = new Document(root);
root.setText("Hello JDOM!");
或者简单的使用 Document doc = new Document(new Element("GREETING").setText("Hello JDOM!t"));
这点和DOM不同。Dom则需要更为复杂的代码,如下:
DocumentBuilderFactory factory =DocumentBuilderFactory.newInstance();
DocumentBuilder builder =factory.newDocumentBuilder();
Document doc = builder.newDocument();
Element root =doc.createElement("root");
Text text = doc.createText("This is the root");
root.appendChild(text);
doc.appendChild(root);
注意事项:JDOM不允许同一个节点同时被2个或多个文档相关联,要在第2个文档中使用原来老文档中的节点的话。首先需要使用detach()把这个节点分开来。
(2) 从文件、流、系统ID、URL得到Document对象:
DOMBuilder builder = new DOMBuilder();
Document doc = builder.build(new File("jdom_test.xml"));
SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(url);
在新版本中DOMBuilder 已经Deprecated掉 DOMBuilder.builder(url),用SAX效率会比较快。
这里举一个小例子,为了简单起见,使用String对象直接作为xml数据源:
public jdomTest() {
String textXml = null;
textXml = "";
textXml = textXml +"aaabbbcccddd";
textXml = textXml + "";
SAXBuilder builder = new SAXBuilder();
Document doc = null;
Reader in= new StringReader(textXml);
try {
doc = builder.build(in);
Element root = doc.getRootElement();
List ls = root.getChildren();// 注意此处取出的是root节点下面的一层的Element集合
for (Iterator iter = ls.iterator(); iter.hasNext(); ) {
Element el = (Element) iter.next();
if(el.getName().equals("to")){
System.out.println(el.getText());
}
}
}
catch (IOException ex) {
ex.printStackTrace();
}
catch (JDOMException ex) {
ex.printStackTrace();
}
}
(3)DOM 的document和JDOM的Document之间的相互转换使用方法
DOMBuilder builder = new DOMBuilder();
org.jdom.Document jdomDocument = builder.build(domDocument);
DOMOutputter converter = new DOMOutputter();// work with the JDOM document …
org.w3c.dom.Document domDocument = converter.output(jdomDocument);
// work with the DOM document …
2.XML 文档输出
XMLOutPutter 类:
JDOM 的输出非常灵活,支持很多种io格式以及风格的输出
Document doc = new Document(...);
XMLOutputter utp = new XMLOutputter();
outp.output(doc, fileOutputStream); // Raw output
outp.setTextTrim(true); // Compressed output
outp.output(doc, socket.getOutputStream());
outp.setIndent(" ");// Pretty output
outp.setNewlines(true);
outp.output(doc, System.out);
详细请参阅最新的JDOM API手册
3.Element 类:
(1) 浏览Element树
Element root = doc.getRootElement();// 获得根元素 element
List allChildren = root.getChildren();// 获得所有子元素的一个 list
List namedChildren = root.getChildren("name");// 获得指定名称子元素的 list
Element child = root.getChild("name");//获得指定名称的第一个子元素
JDOM 给了我们很多很灵活的使用方法来管理子元素(这里的List是java.util.List)
List allChildren = root.getChildren();
allChildren.remove(3); // 删除第四个子元素
allChildren.removeAll(root.getChildren("jack"));// 删除叫“jack”的子元素
root.removeChildren("jack"); // 便捷写法
allChildren.add(new Element("jane"));// 加入
root.addContent(new Element("jane")); // 便捷写法
allChildren.add(0, new Element("first"));
(2) 移动 Elements:
在JDOM里很简单
Element movable = new Element("movable");
parent1.addContent(movable); // place
parent1.removeContent(movable); // remove
parent2.addContent(movable); // add
在Dom里
Element movable = doc1.createElement("movable");
parent1.appendChild(movable); // place
parent1.removeChild(movable); // remove
parent2.appendChild(movable); // 出错 !
补充:纠错性
JDOM 的Element构造函数(以及它的其他函数)会检查element是否合法。
而它的add/remove方法会检查树结构,检查内容如下:
1. 在任何树中是否有回环节点
2. 是否只有一个根节点
3. 是否有一致的命名空间(Namespaces)
(3)Element 的text内容读取
A cool demo
// The text is directly available
// Returns "\n A cool demo\n"
String desc = element.getText();
// Returns "A cool demo"
String desc = element.getTextTrim();
(4)Elment 内容修改
element.setText("A new description");
3. 可正确解释特殊字符
element.setText(" content");
4.CDATA 的数据写入、读出
element.addContent(new CDATA(" content"));
String noDifference = element.getText();
混合内容
element 可能包含很多种内容,比如说
取table的子元素 tr
String text = table.getTextTrim();
Element tr = table.getChild("tr");
也可使用另外一个比较简单的方法
List mixedCo = table.getContent();
Iterator itr = mixedCo.iterator();
while (itr.hasNext()) {
Object o = i.next();
if (o instanceof Comment) {...}
// 这里可以写成Comment, Element, Text, CDATA,ProcessingInstruction, 或者是EntityRef的类型
}
// 现在移除Comment,注意这里游标应为1。这是由于回车键也被解析成Text类的缘故,所以Comment项应为1。
mixedCo.remove(1);
4.Attribute 类
String width = table.getAttributeValue("width");// 获得 attribute
int border = table.getAttribute("width").getIntValue();
table.setAttribute("vspace", "0");//设置 attribute
table.removeAttribute("vspace");// 删除一个或全部 attribute
table.getAttributes().clear();
5.处理指令(Processing Instructions)操作
一个Pls的例子
<?br ?>
<?cocoon-process type="xslt"?>
| |
| |
目标 数据
处理目标名称 (Target)
String target = pi.getTarget();
获得所有数据(data),在目标(target)以后的所有数据都会被返回。
String data = pi.getData();
String type = pi.getValue("type"); 获得指定属性的数据
List ls = pi.getNames(); 获得所有属性的名称
6. 命名空间操作
xmlns:xhtml="http://www.w3.org/1999/xhtml">
Home Page
Namespace xhtml = Namespace.getNamespace("xhtml", "http://www.w3.org/1999/xhtml");
List kids = html.getChildren("title", xhtml);
Element kid = html.getChild("title", xhtml);
kid.addContent(new Element("table", xhtml));
7.XSLT(XSLT 是一种基于XML的语言,用于将一类(class)XML文档转换成另一种XML文档。)格式转换
使用以下函数可对XSLT转换
最后如果你需要使用w3c的Document则需要转换一下。
public static Document transform(String stylesheet , Document in)
throws JDOMException {
try {
Transformer transformer = TransformerFactory.newInstance()
.newTransformer(new StreamSource(stylesheet));
JDOMResult ut = new JDOMResult();
transformer.transform(new JDOMSource(in), out);
return out.getDeocument();
}
catch (TransformerException e) {
throw new JDOMException("XSLT Trandformation failed", e);
}
}
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22434610/viewspace-614820/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22434610/viewspace-614820/