SAX解析
Simple Api for XML。
SAX在解析文档时使用的是边读取边解析的方式,而不是一次性的将文档全部装入内存中。
所以它的读取速度很快,占用很少的内存。
仅向前,不能任意的读取一个节点。
也不能修改XML文件。
SAX读取一个XML文档的过程:
SAX解析器
SAXParserFactory:
定义工厂 API,使应用程序能够配置和获取基于 SAX 的解析器以解析 XML 文档。
SAXParser – 是SAX解析器:
定义包装 XMLReader 实现类的 API 。此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得。
XMLReader-用于读取XML数据:
通过SAXParser. getXMLReader()获得。
parse(String fileName)用于读取一个XML文档。
StAX解析:
The Streaming API for XML基于流的XML编程接口
StAX即可读文档也可以写文档。而SAX只可以读取文档。
StAX的API编程接口
StAX编程接口都位于javax.xml.stream包中。StAX提供了两种方式的编程接口,它们是:
Iterator API:
它的特点是:方便易用、实现简单。
主要类是:XMLEventReader和XMLEventWriter。
Crusor API:
CursorAPI提供两个实现实现对XML的读写,XMLStreamReader负责仅向前的读取数据。XMLStreamWriter可快速且简单的写出一个XML文档。
它的特点是:运行速度快,底层编程。
主要类是:XMLStreamReader和XMLStreamWriter。
Iterator API编程接口
XMLEvent:
提供一系列的属性方法,判断文件是开始、结束。
StartDocument文档的开始
StartElement、EndElement(元素的开始与结束)、Characters(字符串节点元素)
EntityReference 实体引用
Comment注释、EndDocument文档结束,DTD约束
Attribute属性,Namespace命名空间
XMLEventReader:
提供遍历XML文档的能力。它的源代码如下:
public interface XMLEventReader extends Iterator {
可见,它就是一个遍历器。
XMLEventWriter:
XMLEventWriter提供向写XML的功能。
StAX的工厂类
XMLInputFactory、XMLOutputFactory、XMLEventFactory是StAX的工厂类,通过这些类可以获取reader、writer和event的实例。
users.xml
<?xml version="1.0" encoding="UTF-8"?>
<users>
<user id="13214132">
<name>Jack
</name>
<age>20
</age>
</user>
<user id="741561385">
<name>rose</name>
<age>18</age>
</user>
</users>
import java.io.FileReader;
import javax.xml.namespace.QName;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;
import org.junit.Test;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class JAXPDemo {
@Test
public void SAXDemo1() throws Exception, Exception {
//SAXParserFactory,SAXParser,XMLReader
//创建工厂
SAXParserFactory factory=SAXParserFactory.newInstance();
//获取解析器
SAXParser sax=factory.newSAXParser();
//使用XMLReader读取文档
XMLReader r=sax.getXMLReader();
//设置时间监听器--注册解析事件new DefaultHandler(),不能注册多个相同监听器,后面的会将前面的覆盖
r.setContentHandler(new DefaultHandler(){
@Override
public void endDocument() throws SAXException {
System.out.println("文档结束...");
}
@Override
public void startDocument() throws SAXException {
System.out.println("文档开始...");
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
System.out.println("元素结束...");
}
@Override
public void startElement(String uri, String localName,
String qName, Attributes attributes) throws SAXException {
System.out.println("元素开始...");
}
});
//parse开始读取数据
r.parse("./xml/users.xml");
}
@Test
public void SAXDemo2() throws Exception, Exception {
//SAXParserFactory,SAXParser,XMLReader
XMLReader r=SAXParserFactory.newInstance().newSAXParser().getXMLReader();
//设置时间监听器
r.setContentHandler(new DefaultHandler(){
String elementName="";
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
elementName="";
if(qName.equals("user")){
System.out.println("-------");
}
}
@Override
public void startElement(String uri, String localName,
String qName, Attributes attributes) throws SAXException {
if(qName.equals("user")){
String id=attributes.getValue("id");
System.out.println("id:"+id);
}else{
elementName=qName;
}
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {//获取节点文本内容
String str=new String(ch,start,length);
if(elementName.equals("name")||elementName.equals("age")){
System.out.println(elementName+":"+str);
}
}
});
//parse
r.parse("./xml/users.xml");
}
@Test
public void STAXDemo() throws Exception{
XMLEventReader r=XMLInputFactory.newFactory().createXMLEventReader(new FileReader("./xml/users.xml"));
while(r.hasNext()){
XMLEvent xe=r.nextEvent();
if(xe.isStartElement()){
StartElement se=xe.asStartElement();
if(se.getName().getLocalPart().equals("user")){
String id=se.getAttributeByName(new QName("id")).getValue();
System.out.println("ID:"+id);
}
if(se.getName().getLocalPart().equals("name")){
String name=r.nextEvent().asCharacters().toString();
System.out.println("name:"+name);
}
if(se.getName().getLocalPart().equals("age")){
String age=r.nextEvent().asCharacters().toString();
System.out.println("age:"+age);
}
}
if(xe.isEndElement()){
if(xe.asEndElement().getName().getLocalPart().equals("user")){
System.out.println("------------");
}
}
}
}
}
小结:
SAX确实在读取文档上是一边读取一边解析,但它只能读取一次,更不能进行CRUD操作。-基于事件。
在JDK1.6中又添加了SAX的近亲StAX-基于Stream流。
总结:
SAX,StAX读取速度快。都是JAXP的成员。
StAX-Iterator编程接口和Cursor编程接口。
Dom4j,Dom都会将所有节点加载加载到内存中。CRUD非常方便。
Dom4j支持XPath.