java解析xml技术

本文是结合网上资料,对dom,sax,jdom,dom4j的四个小例子,注释中有简单的讲解,主要是供自己学习使用,希望对大家也有所帮助

package com.xml.dom;


import java.io.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

public class Dom {
    /**
     * DOM 是用与平台和语言无关的方式表示 XML 文档的官方 W3C 标准。
     * DOM 是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。
     * 分析该结构通常需要加载整个文档和构造层次结构,然后才能做任何工作。由于它是基于信息层次的,
     * 因而 DOM 被认为是基于树或基于对象的。DOM 以及广义的基于树的处理具有几个优点。首先,由于树
     * 在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在
     * 树中上下导航,而不是像 SAX 那样是一次性的处理。DOM 使用起来也要简单得多。
     * 另一方面,对于特别大的文档,解析和加载整个文档可能很慢且很耗资源,因此使用其他手段来处理
     * 这样的数据会更好。这些基于事件的模型,比如 SAX。
     * @param arge
     */
    public static void main(String arge[]) {
        long lasting = System.currentTimeMillis();
        try {
            File f = new File("src\\test.xml");
            DocumentBuilderFactory factory = DocumentBuilderFactory
                    .newInstance();
            DocumentBuilder builder = factory.newDocumentBuilder();
            Document doc = builder.parse(f);
            NodeList nl = doc.getElementsByTagName("VALUE");
            for (int i = 0; i < nl.getLength(); i++) {
                System.out.print("车牌号码:"
                        + doc.getElementsByTagName("NO").item(i)
                                .getFirstChild().getNodeValue());
                System.out.println(" 车主地址:"
                        + doc.getElementsByTagName("ADDR").item(i)
                                .getFirstChild().getNodeValue());
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        System.out.println("运行时间:" + (System.currentTimeMillis() - lasting)
                + " 毫秒");
    }

}

package com.xml.sax;

import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

/**
 * SAX (SimpleAPIforXML)解析器采用了基于事件的模型,它在解析 XML 文档的时候可以触发一系列的事件,当发现给定的tag的时候,
 * 它可以激活一个回调方法,告诉该方法制定的标签已经找到。SAX 对内存的要求通常会比较低,因为它让开发人
 * 员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时,SAX 这种扩展能力得到
 * 了更好的体现。但用 SAX 解析器的时候编码工作会比较困难,而且很难同时访问同一个文档中的多处不同数据。
 * 与DOM相比,因为在给定的时间之内只需要XML文档的一部分装入内存,所以SAX通常在处理更大文件时内存的利用效率也来得更高
 */
public class Sax extends DefaultHandler {

    java.util.Stack tags = new java.util.Stack();

    public Sax() {
        super();
    }

    public static void main(String args[]) {
        long lasting = System.currentTimeMillis();
        try {
            SAXParserFactory sf = SAXParserFactory.newInstance();
            SAXParser sp = sf.newSAXParser();
            Sax reader = new Sax();
            sp.parse(new InputSource("src\\test.xml"), reader);
        } catch (Exception e) {
            e.printStackTrace();
        }
        System.out.println("运行时间:" + (System.currentTimeMillis() - lasting)
                + " 毫秒");
    }

    public void characters(char ch[], int start, int length)
            throws SAXException {
        String tag = (String) tags.peek();
        if (tag.equals("NO")) {
            System.out.print("车牌号码:" + new String(ch, start, length));
        }
        if (tag.equals("ADDR")) {
            System.out.println(" 地址:" + new String(ch, start, length));
        }
    }

    public void startElement(String uri, String localName, String qName,
            Attributes attrs) {
        tags.push(qName);
    }
}

package com.xml.jdom;

import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;
/**
 * JDOM 的目的是成为 Java 特定文档模型,它简化与 XML 的交互并且比使用 DOM 实现更快。
 * JDOM 与 DOM 主要有两方面不同。
 * 首先,JDOM 仅使用具体类而不使用接口。这在某些方面简化了 API,但是也限制了灵活性。
 * 第二,API 大量使用了 Collections 类,简化了那些已经熟悉这些类的 Java 开发者的使用。
 * JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处
 * 这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能。
 */
public class Jdom {

    public static void main(String arge[]) {
        long lasting = System.currentTimeMillis();
        try {
            SAXBuilder builder = new SAXBuilder();
            Document doc = builder.build(new File("src\\test.xml"));
            Element foo = doc.getRootElement();
            List allChildren = foo.getChildren();
            for (int i = 0; i < allChildren.size(); i++) {
                System.out.print("车牌号码:"
                        + ((Element) allChildren.get(i)).getChild("NO")
                                .getText());
                System.out.println(" 车主地址:"
                        + ((Element) allChildren.get(i)).getChild("ADDR")
                                .getText());
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        System.out.println("运行时间:" + (System.currentTimeMillis() - lasting)
                + " 毫秒");
    }
}

package com.xml.DOM4J;

import java.io.*;
import java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;

public class Dom4j {
/**
 * 虽然 DOM4J 代表了完全独立的开发结果,但最初,它是 JDOM 的一种智能分支。
 * @param arge
 */
public static void main(String arge[]) {
long lasting = System.currentTimeMillis();
try {
    File f = new File("src\\test.xml");
    SAXReader reader = new SAXReader();
    Document doc = reader.read(f);
    Element root = doc.getRootElement();
    Element foo;
    for (Iterator i = root.elementIterator("VALUE"); i.hasNext();) {
        foo = (Element) i.next();
        System.out.print("车牌号码:" + foo.elementText("NO"));
        System.out.println(" 车主地址:" + foo.elementText("ADDR"));
    }
} catch (Exception e) {
    e.printStackTrace();
}
System.out.println("运行时间:" + (System.currentTimeMillis() - lasting) + " 毫秒");
}
}

test.xml文件如下

<?xml version="1.0" encoding="GB2312"?>
    <RESULT>
        <VALUE>
            <NO>A1234</NO>
            <ADDR>河南省 郑州市 小铺村</ADDR>
        </VALUE>
        <VALUE>
            <NO>B1234</NO>
            <ADDR>河南省 郑州市 大浦村</ADDR>
        </VALUE>
    </RESULT>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值