XML解析

Dom 要先读到内存,在进行操作,这样读写速度慢。
SAX 从前往后读取文件,但是只能读取文件,不能操作文件。
JDOM 既能读也能写,速度也快,而且使用java写的
定义

JDOM是一种使用 XML 的独特 Java 工具包,用于快速开发 XML 应用程序。它的设计包含 Java 语言的语法乃至语义。
[编辑本段]说明

JDOM是两位著名的 Java 开发人员兼作者,Brett Mclaughlin 和 Jason Hunter 的创作成果, 2000 年初在类似于 Apache 协议的许可下,JDOM 作为一个开放源代码项目正式开始研发,JDOM 作为一个开放源代码项目正式开始了。它已成长为包含来自广泛的 Java 开发人员的投稿、集中反馈及错误修复的系统,并致力于建立一个完整的基于 Java 平台的解决方案,通过 Java 代码来访问、操作并输出 XML 数据。
  虽然许多Java 开发人员每天都在使用 XML,Sun 却在将 XML 整合进 Java 平台方面落后了。因为在 XML 成为从商家对商家集成到 Web 站点内容流水化等方面的关键技术之前,Java 2 平台就已经非常流行了。Sun 已经使用 JSR 过程使之成为现存 XML API 的鼻祖,这一点已被广泛接受。目前最显著的是加入了 JAXP (用于 XML 语法分析的 Java API),其中包含了三个软件包:
  ·org.w3c.dom ,W3C 推荐的用于 XML 标准规划文档对象模型的 Java 工具
  ·org.xml.sax ,用于对 XML 进行语法分析的事件驱动的简单 API
  ·javax.xml.parsers ,工厂化工具,允许应用程序开发人员获得并配置特殊的语法分析器工具 JDOM 能够替换 org.w3c.dom 软件包来有计划地操作 XML 文档
  JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。
  JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念以及映射),把SAX和DOM的功能有效地结合起来。
  Jdom是用Java语言读、写、操作XML的新API函数。Jason Hunter 和 Brett McLaughlin公开发布了它的1.0版本。在直觉、简单和高效的前提下,这些API函数被最大限度的优化。在接下来的篇幅里将介绍怎么用Jdom去读写一个已经存在的XML文档。
  在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。
  JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处。
  这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA程序员在使用时来用起来总觉得不太方便。
  DOM的缺点主要是来自于由于Dom是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的。JDOM的最新版本为JDOM Beta 9。最近JDOM被收录到JSR-102内,这标志着JDOM成为了JAVA平台组成的一部分。
  在 JDOM 中,XML 元素就是 Element 的实例,XML 属性就是 Attribute 的实例,XML 文档本身就是 Document 的实例。
  因为 JDOM 对象就是像 Document、Element 和 Attribute 这些类的直接实例,因此创建一个新 JDOM 对象就如在 Java 语言中使用 new 操作符一样容易。JDOM 的使用是直截了当的。
  JDOM 使用标准的 Java 编码模式。只要有可能,它使用 Java new 操作符而不故弄玄虚使用复杂的工厂化模式,使对象操作即便对于初学用户也很方便。
[编辑本段]JDOM包概览


  JDOM是由以下几个包组成的
  org.jdom包含了所有的xml文档要素的java类
  org.jdom.adapters包含了与dom适配的java类
  org.jdom.filter包含了xml文档的过滤器类
  org.jdom.input包含了读取xml文档的类
  org.jdom.output包含了写入xml文档的类
  org.jdom.transform包含了将jdomxml文档接口转换为其他xml文档接口
  org.jdom.xpath包含了对xml文档xpath操作的类
[编辑本段]JDOM类说明


  1、org.JDOM这个包里的类是你解析xml文件后所要用到的所有数据类型。
  Attribute
  CDATA
  Coment
  DocType
  Document
  Element
  EntityRef
  Namespace
  ProscessingInstruction
  Text
  2、org.JDOM.transform在涉及xslt格式转换时应使用下面的2个类
  JDOMSource
  JDOMResult
  org.JDOM.input
  3、输入类,一般用于文档的创建工作
  SAXBuilder
  DOMBuilder
  ResultSetBuilder
  4、org.JDOM.output输出类,用于文档转换输出
  XMLOutputter
  SAXOutputter
  DomOutputter
  JTreeOutputter
  使用前注意事项:
  1.JDOM对于JAXP以及TRax的支持
  JDOM支持JAXP1.1:你可以在程序中使用任何的parser工具类,默认情况下是JAXP的parser。
  制定特别的parser可用如下形式
  SAXBuilderparser
  =newSAXBuilder("org.apache.crimson.parser.XMLReaderImpl");
  Documentdoc=parser.build("http://www.cafeconleche.org/");
  //workwiththedocument...
  JDOM也支持TRaX:XSLT可通过JDOMSource以及JDOMResult类来转换(参见以后章节)
  2.注意在JDOM里文档(Document)类由org.JDOM.Document来表示。这要与org.w3c.dom中的Document区别开,这2种格式如何转换在后面会说明。
  以下如无特指均指JDOM里的Document。
[编辑本段]JDOM主要使用方法


  1.Ducument类
  (1)Document的操作方法:
  Element root=new Element("GREETING");
  Document doc=new Document(root);
  root.setText("HelloJDOM!");
  或者简单的使用Document doc=new Document(new Element("GREETING").setText("HelloJDOM!t"));
  这点和DOM不同。Dom则需要更为复杂的代码,如下:
  DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
  DocumentBuilder builder=factory.newDocumentBuilder();
  Documentdoc=builder.newDocument();
  Element root=doc.createElement("root");
  Text text=doc.createText("Thisistheroot");
  root.appendChild(text);
  doc.appendChild(root);
  注意事项:JDOM不允许同一个节点同时被2个或多个文档相关联,要在第2个文档中使用原来老文档中的节点的话。首先需要使用detach()把这个节点分开来。
  (2)从文件、流、系统ID、URL得到Document对象:
  DOMBuilder builder=new DOMBuilder();
  Document doc=builder.build(newFile("jdom_test.xml"));
  SAXBuilder builder=new SAXBuilder();
  Document doc=builder.build(url);
  在新版本中DOMBuilder已经Deprecated掉DOMBuilder.builder(url),用SAX效率会比较快。
  这里举一个小例子,为了简单起见,使用String对象直接作为xml数据源:
  Public jdom Test(){
  String textXml=null;
  textXml="";
  textXml=textXml+
  "aaabbbcccddd";
  textXml=textXml+"";
  SAXBuilder builder=new SAXBuilder();
  Document doc=null;
  Reader in=new StringReader(textXml);
  try{
  doc=builder.build(in);
  Element root=doc.getRootElement();
  List ls=root.getChildren();//注意此处取出的是root节点下面的一层的Element集合
  for(Iteratoriter=ls.iterator();iter.hasNext();){
  Element el=(Element)iter.next();
  if(el.getName().equals("to")){
  System.out.println(el.getText());
  }
  }
  }
  catch(IOExceptionex){
  ex.printStackTrace();
  }
  catch(JDOMExceptionex){
  ex.printStackTrace();
  }
  }
  (3)DOM的document和JDOM的Document之间的相互转换使用方法,简单!
  DOMBuilder builder=new DOMBuilder();
  org.jdom.Document jdomDocument=builder.build(domDocument);
  DOMOutputter converter=newDOMOutputter();//workwiththeJDOMdocument…
  org.w3c.dom.Document domDocument=converter.output(jdomDocument);
  //workwiththeDOMdocument…
  2.XML文档输出
  XMLOutPutter类:
  JDOM的输出非常灵活,支持很多种io格式以及风格的输出
  Document doc=newDocument(...);
  XMLOutputter outp=newXMLOutputter();
  outp.output(doc,fileOutputStream);//Rawoutput
  outp.setTextTrim(true);//Compressedoutput
  outp.output(doc,socket.getOutputStream());
  outp.setIndent("");//Prettyoutput
  outp.setNewlines(true);
  outp.output(doc,System.out);
  详细请参阅最新的JDOMAPI手册
  3.Element类:
  (1)浏览Element树
  Element root=doc.getRootElement();//获得根元素element
  List allChildren=root.getChildren();//获得所有子元素的一个list
  List namedChildren=root.getChildren("name");//获得指定名称子元素的list
  Element child=root.getChild("name");//获得指定名称的第一个子元素
  JDOM给了我们很多很灵活的使用方法来管理子元素(这里的List是java.util.List)
  List allChildren=root.getChildren();
  allChildren.remove(3);//删除第四个子元素
  allChildren.removeAll(root.getChildren("jack"));//删除叫“jack”的子元素
  root.removeChildren("jack");//便捷写法
  allChildren.add(newElement("jane"));//加入
  root.addContent(newElement("jane"));//便捷写法
  allChildren.add(0,newElement("first"));
  (2)移动Elements:
  在JDOM里很简单
  Element movable=newElement("movable");
  parent1.addContent(movable);//place
  parent1.removeContent(movable);//remove
  parent2.addContent(movable);//add
  在Dom里
  Element movable=doc1.createElement("movable");
  parent1.appendChild(movable);//place
  parent1.removeChild(movable);//remove
  parent2.appendChild(movable);//出错!
  补充:纠错性
  JDOM的Element构造函数(以及它的其他函数)会检查element是否合法。
  而它的add/remove方法会检查树结构,检查内容如下:
  1.在任何树中是否有回环节点
  2.是否只有一个根节点
  3.是否有一致的命名空间(Namespaces)
  (3)Element的text内容读取
  Acooldemo
  //Thetextisdirectlyavailable
  //Returns"\nAcooldemo\n"
  String desc=element.getText();
  //There'saconvenientshortcut
  //Returns"Acooldemo"
  String desc=element.getTextTrim();
  (4)Elment内容修改
  element.setText("Anewdescription");
  3.可正确解释特殊字符
  element.setText("
[编辑本段]JDOM的应用


  (一)、XML文档创建
  我们由零开始利用JDOM生成一个XML文档。最后的结果(样本文档)看起来象这样:
  kingwong
  87654321
  1.以 MyInfo 为根元素创建文档
  Element rootElement = new Element("MyInfo");//所有的XML元素都是 Element 的实例。根元素也不例外:)
  Document myDocument = new Document(rootElement);//以根元素作为参数创建Document对象。一个Document只有一个根,即root元素。
  2.给根元素添加属性
  Attribute rootAttri = new Attribute("comment","introduce myself");//创建名为 commnet,值为 introduce myself 的属性。
  rootElement.setAttribute(rootAttri);//将刚创建的属性添加到根元素。
  这两行代码你也可以合成一行来写,象这样:
  rootElement.setAttribute(new Attribute("comment","introduce myself"));
  或者
  rootElement.setAttribute("comment","introduce myself");
  3.添加元素和子元素
  JDOM里子元素是作为 content(内容)添加到父元素里面去的,所谓content就是类似上面样本文档中之间的东东,即kingwong。啰嗦了点是吧:)
  Element nameElement = new Element("name");//创建 name 元素
  nameElement.addContent("kingwong");//将kingwong作为content添加到name元素
  rootElement.addContent(nameElement);//将name元素作为content添加到根元素
  这三行你也可以合为一句,象这样:
  rootElement.addContent((Content)(new Element("name").addContent("kingwong")));//因为addContent(Content child)方法返回的是一个Parent接口,而Element类同时继承了Content类和实现了Parent接口,所以我们把它造型成Content。
  我们用同样的方法添加带属性的子元素
  rootElement.addContent(new Element("sex").setAttribute("value","male"));//注意这里不需要转型,因为addAttribute(String name,String value)返回值就是一个 Element。
  同样的,我们添加元素到根元素下,用法上一样,只是稍微复杂了一些:
  rootElement.addContent((Content)(new Element("contact").addContent((Content)(new Element("telephone").addContent("87654321")))));
  如果你对这种简写形式还不太习惯,你完全可以分步来做,就象本节刚开始的时候一样。事实上如果层次比较多,写成分步的形式更清晰些,也不容易出错。
  4.删除子元素
  这个操作比较简单:
  rootElement.removeChild("sex");//该方法返回一个布尔值
  到目前为止,我们学习了一下JDOM文档生成操作。上面建立了一个样本文档,可是我们怎么知道对不对呢?因此需要输出来看一下。我们将JDOM生成的文档输出到控制台,使用 JDOM 的 XMLOutputter 类。
  5. 将 JDOM 转化为 XML 文本
  XMLOutputter xmlOut = new XMLOutputter(" ",true);
  try {
  xmlOut.output(myDocument,System.out);
  } catch (IOException e) {
  e.printStackTrace();
  }
  XMLOutputter 有几个格式选项。这里我们已指定希望子元素从父元素缩进两个空格,并且希望元素间有空行。
  new XMLOutputter(java.lang.String indent, boolean newlines)这个方法在最新版本中已经不建议使用。JDOM有一个专门的用来定义格式化输出的类:org.jdom.output.Format,如果你没有特殊的要求,有时候使用里面的几个静态方法(应该可以说是预定义格式)如 getPrettyFormat()就可以了。我们把上面的输出格式稍微改一下,就象这样:
  XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());
  6.将JDOM文档转化为其他形式
  XMLOutputter 还可输出到 Writer 或 OutputStream。为了输出JDOM文档到一个文本文件,我们可以这样做:
  FileWriter writer = new FileWriter("/some/directory/myFile.xml");
  outputter.output(myDocument, writer);
  writer.close();
  XMLOutputter 还可输出到字符串,以便程序后面进行再处理:
  Strng outString = xmlOut.outputString(myDocument);
  当然,在输出的时候你不一定要输出所有的整个文档,你可以选择元素进行输出:
  xmlOut.output(rootElement.getChild("name"),System.out);
  一句话,JDOM非常灵活方便!如果你想进一步研究JDOM,请到官方网站去看一看:http://www.jdom.org
  本节示例源码:
  package com.cyberobject.study;
  import java.io.IOException;
  import org.jdom.Attribute;
  import org.jdom.Content;
  import org.jdom.Document;
  import org.jdom.Element;
  import org.jdom.output.Format;
  import org.jdom.output.XMLOutputter;
  /**
  * @author kingwong
  *
  * TODO To change the template for this generated type comment go to
  * Window - Preferences - Java - Code Style - Code Templates
  */
  public class TestJDOM {
  public static void main(String[] args)
  {
  Element rootElement = new Element("MyInfo");
  Document myDocument = new Document(rootElement);
  // Attribute rootAttri = new Attribute("comment","introduce myself");
  // rootElement.setAttribute(rootAttri);
  rootElement.setAttribute("comment","introduce myself");
  //rootElement.setAttribute(new Attribute("comment","introduce myself"));
  // Element sexElement = new Element("sex");
  // rootElement.addContent(sexElement);
  // Element nameElement = new Element("name");
  // nameElement.addContent("kingwong");
  // rootElement.addContent(nameElement);
  rootElement.addContent((Content)(new Element("name").addContent("kingwong")));
  rootElement.addContent(new Element("sex").setAttribute("value","male"));
  rootElement.addContent((Content)(new Element("contract").addContent((Content)(new Element("telephone").addContent("87654321")))));
  rootElement.removeChild("sex");
  XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());
  try {
  xmlOut.output(myDocument,System.out);
  //xmlOut.output(rootElement.getChild("name"),System.out);
  //String outString = xmlOut.outputString(myDocument);
  } catch (IOException e) {
  e.printStackTrace();
  }
  }
  }
[编辑本段]XML文档解析


  JDOM 不光可以很方便的建立XML文档,它的另一个用处是它能够读取并操作现有的 XML 数据。
  JDOM的解析器在org.jdom.input.*这个包里,其中的DOMBuilder的功能是将DOM模型的Document解析成JDOM模型的Document;SAXBuilder的功能是从文件或流中解析出符合JDOM模型的XML树。由于我们经常要从一个文件里读取数据,因此我们应该采用后者作为解析工具。
  解析一个xml文档,基本可以看成以下几个步骤:
  1.实例化一个合适的解析器对象
  本例中我们使用SAXBuilder:
  SAXBuilder sb = new SAXBuilder();
  2.以包含XML数据的文件为参数,构建一个文档对象myDocument
  Document myDocument = sb.build(/some/directory/myFile.xml);
  3.获到根元素
  Element rootElement = myDocument.getRootElement();
  一旦你获取了根元素,你就可以很方便地对它下面的子元素进行操作了,下面对Element对象的一些常用方法作一下简单说明:
  getChild("childname") 返回指定名字的子节点,如果同一级有多个同名子节点,则只返回第一个;如果没有返回null值。
  getChildren("childname") 返回指定名字的子节点List集合。这样你就可以遍历所有的同一级同名子节点。
  getAttributeValue("name") 返回指定属性名字的值。如果没有该属性则返回null,有该属性但是值为空,则返回空字符串。
  getChildText("childname") 返回指定子节点的内容文本值。
  getText() 返回该元素的内容文本值。
  还有其他没有罗列出来的方法,如果需要的话,可以随时查阅JDOM的在线文档:http://www.jdom.org/docs/apidocs/index.html。当然你可以在你需要的地方添加、删除元素操作,还记得上面的创建XML的方法吗?呵呵~~~
  学习新东东还是从实例学起最为快捷,下面简单举个例子,就以上面的XML样本代码来学习JDOM的XML解析。本例中读取了样本XML文件里一些属性和content,最后我们还在contact元素里插入了一个新元素wanghua@cyberobject.com" />。尽管我们实现了对于XML的基本操作,细心的朋友可能会
  有疑问:如果XML文档的层次稍微复杂一些,如果嵌套多达几十上百层的话(开个玩笑),如果靠这样从根元素一级一级地通过getChild("childname")来访问子元素的话,将会非常痛苦!是的,的确是这样,但是我们有另一个有力的工具XPath,为什么不用呢?这是后话!先卖个关子(手敲累啦,下回吧,呵呵)。
  /*
  * Created on 2004-8-21
  *
  * TODO To change the template for this generated file go to
  * Window - Preferences - Java - Code Style - Code Templates
  */
  package com.cyberobject.study;
  import org.jdom.Document;
  import org.jdom.Element;
  import org.jdom.input.SAXBuilder;
  import org.jdom.output.Format;
  import org.jdom.output.XMLOutputter;
  /**
  * @author kingwong
  *
  * TODO To change the template for this generated type comment go to
  * Window - Preferences - Java - Code Style - Code Templates
  */
  public class TestJDOM2 {
  public static void main(String[] args){
  SAXBuilder sb = new SAXBuilder();
  try
  {
  Document doc = sb.build("myFile.xml");
  Element root = doc.getRootElement();
  String str1 = root.getAttributeValue("comment");
  System.out.println("Root Element's comment attribute is : " + str1);
  String str2 = root.getChild("sex").getAttributeValue("value");
  System.out.println("sex Element's value attribute is : " + str2);
  String str3 = root.getChildText("name");
  System.out.println("name Element's content is :" + str3);
  String str4 = root.getChild("contact").getChildText("telephone");
  System.out.println("contact Element's telephone subelement content is : " + str4 + "\n");
  Element inputElement = root.getChild("contact");
  inputElement.addContent(new Element("email").setAttribute("value","wanghua@cyberobject.com"));
  XMLOutputter xmlOut = new XMLOutputter(Format.getPrettyFormat());
  String outStr = xmlOut.outputString(root);
  System.out.println(outStr);
  }
  catch(Exception e)
  {
  e.printStackTrace();
  }
  }
  }

扩展阅读:
1.http://www.java2000.net/p1431 JDom例子
2.http://www.java2000.net/p122 JDOM使用详解XML及实例
3.http://www.itisedu.com/phrase/200604181210165.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值