java解析xml技术-CSDN博客

本文链接：https://blog.csdn.net/jingyuwang1/article/details/7555340

本文是结合网上资料，对dom,sax,jdom,dom4j的四个小例子，注释中有简单的讲解，主要是供自己学习使用，希望对大家也有所帮助

package com.xml.dom;

import java.io.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

public class Dom {
   /**
   * DOM 是用与平台和语言无关的方式表示 XML 文档的官方 W3C 标准。
   * DOM 是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。
   * 分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，
   * 因而 DOM 被认为是基于树或基于对象的。DOM 以及广义的基于树的处理具有几个优点。首先，由于树
   * 在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在
   * 树中上下导航，而不是像 SAX 那样是一次性的处理。DOM 使用起来也要简单得多。
   * 另一方面，对于特别大的文档，解析和加载整个文档可能很慢且很耗资源，因此使用其他手段来处理
   * 这样的数据会更好。这些基于事件的模型，比如 SAX。
   * @param arge
   */
   public static void main(String arge[]) {
       long lasting = System.currentTimeMillis();
       try {
           File f = new File("src\\test.xml");
           DocumentBuilderFactory factory = DocumentBuilderFactory
                   .newInstance();
           DocumentBuilder builder = factory.newDocumentBuilder();
           Document doc = builder.parse(f);
           NodeList nl = doc.getElementsByTagName("VALUE");
           for (int i = 0; i < nl.getLength(); i++) {
               System.out.print("车牌号码:"
                       + doc.getElementsByTagName("NO").item(i)
                               .getFirstChild().getNodeValue());
               System.out.println(" 车主地址:"
                       + doc.getElementsByTagName("ADDR").item(i)
                               .getFirstChild().getNodeValue());
           }
       } catch (Exception e) {
           e.printStackTrace();
       }
       System.out.println("运行时间：" + (System.currentTimeMillis() - lasting)
               + " 毫秒");
   }

}

package com.xml.sax;

import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

/**
* SAX （SimpleAPIforXML）解析器采用了基于事件的模型，它在解析 XML 文档的时候可以触发一系列的事件，当发现给定的tag的时候，
* 它可以激活一个回调方法，告诉该方法制定的标签已经找到。SAX 对内存的要求通常会比较低，因为它让开发人
* 员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时，SAX 这种扩展能力得到
* 了更好的体现。但用 SAX 解析器的时候编码工作会比较困难，而且很难同时访问同一个文档中的多处不同数据。
* 与DOM相比，因为在给定的时间之内只需要XML文档的一部分装入内存，所以SAX通常在处理更大文件时内存的利用效率也来得更高
*/
public class Sax extends DefaultHandler {

   java.util.Stack tags = new java.util.Stack();

   public Sax() {
       super();
   }

   public static void main(String args[]) {
       long lasting = System.currentTimeMillis();
       try {
           SAXParserFactory sf = SAXParserFactory.newInstance();
           SAXParser sp = sf.newSAXParser();
           Sax reader = new Sax();
           sp.parse(new InputSource("src\\test.xml"), reader);
       } catch (Exception e) {
           e.printStackTrace();
       }
       System.out.println("运行时间：" + (System.currentTimeMillis() - lasting)
               + " 毫秒");
   }

   public void characters(char ch[], int start, int length)
           throws SAXException {
       String tag = (String) tags.peek();
       if (tag.equals("NO")) {
           System.out.print("车牌号码：" + new String(ch, start, length));
       }
       if (tag.equals("ADDR")) {
           System.out.println(" 地址:" + new String(ch, start, length));
       }
   }

   public void startElement(String uri, String localName, String qName,
           Attributes attrs) {
       tags.push(qName);
   }
}

package com.xml.jdom;

import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;
/**
* JDOM 的目的是成为 Java 特定文档模型，它简化与 XML 的交互并且比使用 DOM 实现更快。
* JDOM 与 DOM 主要有两方面不同。
* 首先，JDOM 仅使用具体类而不使用接口。这在某些方面简化了 API，但是也限制了灵活性。
* 第二，API 大量使用了 Collections 类，简化了那些已经熟悉这些类的 Java 开发者的使用。
* JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来，以弥补DOM及SAX在实际应用当中的不足之处
* 这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能。
*/
public class Jdom {

   public static void main(String arge[]) {
       long lasting = System.currentTimeMillis();
       try {
           SAXBuilder builder = new SAXBuilder();
           Document doc = builder.build(new File("src\\test.xml"));
           Element foo = doc.getRootElement();
           List allChildren = foo.getChildren();
           for (int i = 0; i < allChildren.size(); i++) {
               System.out.print("车牌号码:"
                       + ((Element) allChildren.get(i)).getChild("NO")
                               .getText());
               System.out.println(" 车主地址:"
                       + ((Element) allChildren.get(i)).getChild("ADDR")
                               .getText());
           }
       } catch (Exception e) {
           e.printStackTrace();
       }
       System.out.println("运行时间：" + (System.currentTimeMillis() - lasting)
               + " 毫秒");
   }
}

package com.xml.DOM4J;

import java.io.*;
import java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;

public class Dom4j {
/**
* 虽然 DOM4J 代表了完全独立的开发结果，但最初，它是 JDOM 的一种智能分支。
* @param arge
*/
public static void main(String arge[]) {
long lasting = System.currentTimeMillis();
try {
    File f = new File("src\\test.xml");
    SAXReader reader = new SAXReader();
    Document doc = reader.read(f);
    Element root = doc.getRootElement();
    Element foo;
    for (Iterator i = root.elementIterator("VALUE"); i.hasNext();) {
        foo = (Element) i.next();
        System.out.print("车牌号码:" + foo.elementText("NO"));
        System.out.println(" 车主地址:" + foo.elementText("ADDR"));
    }
} catch (Exception e) {
    e.printStackTrace();
}
System.out.println("运行时间：" + (System.currentTimeMillis() - lasting) + " 毫秒");
}
}

test.xml文件如下

<?xml version="1.0" encoding="GB2312"?>
    <RESULT>
        <VALUE>
            <NO>A1234</NO>
            <ADDR>河南省郑州市小铺村</ADDR>
        </VALUE>
        <VALUE>
            <NO>B1234</NO>
            <ADDR>河南省郑州市大浦村</ADDR>
        </VALUE>
    </RESULT>