java--JAXP对xml文档的解析

SAX解析
Simple Api for XML。
SAX在解析文档时使用的是边读取边解析的方式,而不是一次性的将文档全部装入内存中。
所以它的读取速度很快,占用很少的内存。
仅向前,不能任意的读取一个节点。
也不能修改XML文件。
SAX读取一个XML文档的过程:
这里写图片描述
SAX解析器
SAXParserFactory:
    定义工厂 API,使应用程序能够配置和获取基于 SAX 的解析器以解析 XML 文档。
SAXParser – 是SAX解析器:
    定义包装 XMLReader 实现类的 API 。此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得。
XMLReader-用于读取XML数据:
    通过SAXParser. getXMLReader()获得。
    parse(String fileName)用于读取一个XML文档。
StAX解析:
The Streaming API for XML基于流的XML编程接口
StAX即可读文档也可以写文档。而SAX只可以读取文档。
StAX的API编程接口
StAX编程接口都位于javax.xml.stream包中。StAX提供了两种方式的编程接口,它们是:
Iterator API:
    它的特点是:方便易用、实现简单。
    主要类是:XMLEventReader和XMLEventWriter。
Crusor API:
CursorAPI提供两个实现实现对XML的读写,XMLStreamReader负责仅向前的读取数据。XMLStreamWriter可快速且简单的写出一个XML文档。
    它的特点是:运行速度快,底层编程。
    主要类是:XMLStreamReader和XMLStreamWriter。
Iterator API编程接口
XMLEvent:
提供一系列的属性方法,判断文件是开始、结束。
StartDocument文档的开始
StartElement、EndElement(元素的开始与结束)、Characters(字符串节点元素)
EntityReference 实体引用
Comment注释、EndDocument文档结束,DTD约束
Attribute属性,Namespace命名空间
XMLEventReader:
提供遍历XML文档的能力。它的源代码如下:
public interface XMLEventReader extends Iterator {
可见,它就是一个遍历器。
XMLEventWriter:
XMLEventWriter提供向写XML的功能。
StAX的工厂类
XMLInputFactory、XMLOutputFactory、XMLEventFactory是StAX的工厂类,通过这些类可以获取reader、writer和event的实例。
users.xml

<?xml version="1.0" encoding="UTF-8"?>
<users>
    <user id="13214132">
        <name>Jack
        </name>
        <age>20
        </age>
    </user>
    <user id="741561385">
        <name>rose</name>
        <age>18</age>
    </user>
</users>
import java.io.FileReader;

import javax.xml.namespace.QName;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;

import org.junit.Test;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class JAXPDemo {

    @Test
    public  void SAXDemo1() throws Exception, Exception {
        //SAXParserFactory,SAXParser,XMLReader
        //创建工厂
        SAXParserFactory factory=SAXParserFactory.newInstance();
        //获取解析器
        SAXParser sax=factory.newSAXParser();
        //使用XMLReader读取文档
        XMLReader r=sax.getXMLReader();

        //设置时间监听器--注册解析事件new DefaultHandler(),不能注册多个相同监听器,后面的会将前面的覆盖
        r.setContentHandler(new DefaultHandler(){
            @Override
            public void endDocument() throws SAXException {
                System.out.println("文档结束...");
            }
            @Override
            public void startDocument() throws SAXException {
                System.out.println("文档开始...");
            }
            @Override
            public void endElement(String uri, String localName, String qName)
                    throws SAXException {
                    System.out.println("元素结束...");
            }
            @Override
            public void startElement(String uri, String localName,
                    String qName, Attributes attributes) throws SAXException {
                    System.out.println("元素开始...");
            }
        });
        //parse开始读取数据
        r.parse("./xml/users.xml");

    }
    @Test
    public  void SAXDemo2() throws Exception, Exception {
        //SAXParserFactory,SAXParser,XMLReader
        XMLReader r=SAXParserFactory.newInstance().newSAXParser().getXMLReader();

        //设置时间监听器
        r.setContentHandler(new DefaultHandler(){

            String elementName="";
            @Override
            public void endElement(String uri, String localName, String qName)
                    throws SAXException {
                elementName="";
                if(qName.equals("user")){
                    System.out.println("-------");
                }
            }

            @Override
            public void startElement(String uri, String localName,
                    String qName, Attributes attributes) throws SAXException {
                if(qName.equals("user")){
                    String id=attributes.getValue("id");
                    System.out.println("id:"+id);
                }else{
                    elementName=qName;
                }
            }

            @Override
            public void characters(char[] ch, int start, int length)
                    throws SAXException {//获取节点文本内容
                String str=new String(ch,start,length);
                if(elementName.equals("name")||elementName.equals("age")){
                    System.out.println(elementName+":"+str);
                }
            }

        });

        //parse
        r.parse("./xml/users.xml");

    }
    @Test
    public void STAXDemo() throws Exception{
        XMLEventReader r=XMLInputFactory.newFactory().createXMLEventReader(new FileReader("./xml/users.xml"));
        while(r.hasNext()){
            XMLEvent xe=r.nextEvent();
            if(xe.isStartElement()){
                StartElement se=xe.asStartElement();
                if(se.getName().getLocalPart().equals("user")){
                    String id=se.getAttributeByName(new QName("id")).getValue();
                    System.out.println("ID:"+id);

                }
                if(se.getName().getLocalPart().equals("name")){
                    String name=r.nextEvent().asCharacters().toString();
                    System.out.println("name:"+name);

                }
                if(se.getName().getLocalPart().equals("age")){
                    String age=r.nextEvent().asCharacters().toString();
                    System.out.println("age:"+age);

                }
            }
            if(xe.isEndElement()){
                if(xe.asEndElement().getName().getLocalPart().equals("user")){
                    System.out.println("------------");
                }
            }
        }
    }
}

小结:
SAX确实在读取文档上是一边读取一边解析,但它只能读取一次,更不能进行CRUD操作。-基于事件。
在JDK1.6中又添加了SAX的近亲StAX-基于Stream流。
总结:
SAX,StAX读取速度快。都是JAXP的成员。
StAX-Iterator编程接口和Cursor编程接口。
Dom4j,Dom都会将所有节点加载加载到内存中。CRUD非常方便。

Dom4j支持XPath.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值