(六) 流机制解析器

DOM解析器读入的是一个完整的XML文档,然后将其转换成一个树形的数据结构,对于大多数应用,DOM都运行得很好,但是当文档很大,并且处理算法非常简单,可以在运行时解析节点,而不必看到所有的树形结构时,DOM可能会显得效率低下。在这种情况下,我们应该使用 流解析机制(streaming parser)。
SAX解析器使用的是事件回调(event callback),而StAX解析器提供了解析事件的迭代器。

1.使用SAX解析器
SAX解析器在解析XML输入结构时就报告事件,但不会以任何方式存储文档。由事件处理器决定是否要建立数据结构。实际上,DOM解析器是在SAX解析器的基础上建立起来的,它在接收到解析器事件时建立DOM树。
在使用SAX解析器时,需要一个处理器来定义不同的解析器事件的事件动作,ContentHandler接口定义了若干回调方法。
其中最重要的几个:
(1)startElement和endElement在每当遇到起始或终止标签时调用。
(2)characters每当遇到字符数据时调用。
(3)startDocument和endDocument分别在文档开始和结束时各调用一次。

例:解析一下片段

<font>
    <name>Helvetica</name>
    <size units="pt">36</size>
</font>
 


解析器确保产生一下调用
(1)startElement,元素名:font
(2)startElement,元素名:name
(3)characters,内容:Helvetica
(4)endElement,元素名:name
(5)startElement,元素名:size,属性:units="pt"
(6)characters,内容:36
(7)endElement,元素名:size
(8)endElement,元素名:font
处理器必须覆盖这些方法,让它们执行在解析文件时想要执行的动作。

SAX解析流程
(1)SAX解析需要SAXParser

    SAXParserFactory factory = SAXParseFactory.newInstance();
    SAXParser parser = factory.newSAXParser();
 


(2)开始解析文档

    parser.parse(source, handler);
 


(3)这里的source可以是一个文件、一个URL字符串或者是一个输入流。处理器属于DefaultHandler的一个子类,DefaultHandler类为以下四个接口定义了空的方法:
    ContentHandler
    DTDHandler
    EntityResolver
    ErrorHandler

示例程序中定义了一个处理器,它覆盖了ContentHandler接口的startElement方法来观察带有href属性的a元素。

    DefaultHandler hanler = new DefaultHandler(
        public void startElement(String namespaceURI, String lname, String qname, Attributes attrs) throws SAXException{
            if(lname.equalsIgnoreCase("a") && attrs != null){
                for(int i=0;i<attrs.getLength();i++){
                    String aname = attrs.getLocalName(i);
                    if(aname.equalsIgnoreCase("href")){
                        System.out.println(attrs.getValue(i));
                    }
                }
            }
        }
    );
 


   
startElement方法有3个描述元素名的参数,其中qname参数以alias:localname的形式报告限定名。如果命名空间处理特征已经打开,那么namespaceURI和lname参数描述的就是命名空间和本地(非限定)名。
与DOM解析器一样,命名空间处理特性默认是关闭的,可以调用工厂类的setNamespaceAware方法来激活命名空间处理特性:

    SAXParserFactory  factory = SAXParserFactory.newInstance();
    factory.setNamespaceAware(true);
    SAXParser saxParser = factory.newSAXParser();

 

DEMO

package xml.sax;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXTest {
	public static void main(String[] args) {
		String url;
		
		if(args.length == 0){
			url = "http://www.w3c.org";
			System.out.println("Using" + url);
		}else{
			url = args[0];
		}
		
		DefaultHandler handler = new DefaultHandler(){
			public void startElement(String namespaceURI, String lname, String qname, Attributes attrs){
				if("a".equals(lname) && attrs !=null){
					for(int i=0;i<attrs.getLength();i++){
						String aname = attrs.getLocalName(i);
						if("href".equals(aname)){
							System.out.println(attrs.getValue(i));
						}
					}
				}
			}
		};
		try{
			SAXParserFactory factory = SAXParserFactory.newInstance();
			factory.setNamespaceAware(true);
			SAXParser saxParser = factory.newSAXParser();
		}catch(ParserConfigurationException e){
			e.printStackTrace();
		}catch(SAXException e){
			e.printStackTrace();
		}
		
	}
	
	
}
 

2.使用StAX解析器
StAX解析器是一种“拉解析器(pull parser)”,与安装事件处理器不同,只需要使用基本循环来迭代所有事件

    InputStream in = new URL(url).openStream();
    XMLInputFactory factory = XMLInputFactory.newInstance();
    XMLStreamReader parser = factory.createXMLStreamReader(in);
   
    while(parser.hasNext()){
        int event = parser.next();
        System.out.println("Call parser methods to obtain event details");
    }
 


例,解析下面的片断

    <font>
        <name>Helvetica</name>
        <size units="pt">36</size>
    </font>
 


解析器将产生以下事件:
(1)START_ELEMENT,元素名:font
(2)CHARACTERS,内容:空白字符
(3)START_ELEMENT,元素名:name
(4)CHARACTERS,内容:Helvetica
(5)END_ELEMENT,元素名:name
(6)CHARACTERS,内容:空白字符
(7)START_ELEMENT,内容:元素名:size
(8)CHARACTERS,内容:36
(9)END_ELEMENT,元素名:size
(10)CHARACTERS,内容:空白字符
(11)END_ELEMENT,元素名:font
要分析这些属性值,需要调用XMLStreamReader类的恰当方法
例:

    String units = parser.getAttributeValue(null, "units");
 


    获取当前元素的units属性。
默认情况下,支持命名空间的处理,可以通过修改工厂来设置为无效。

    XMLInputFactory factory = XMLInputFactory.newInstance();
    factory.setProperty(XMLInputFactory.IS_NAMESPACE_AWARE, false);
 

DEMO

package xml.stax;

import java.io.File;
import java.io.FileInputStream;

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;

public class StAXTest {
	public static void main(String[] args) {
		try{
			String filename = System.getProperty("user.dir") + File.separator + "conf" 
					+ File.separator +"xml" + File.separator + "中文路径" + File.separator + "www.w3.org.xml";
			File file = new File(filename);
			FileInputStream in = new FileInputStream(file);
			
			XMLInputFactory factory = XMLInputFactory.newInstance();
			factory.setProperty(XMLInputFactory.IS_NAMESPACE_AWARE, false);
			XMLStreamReader parser = factory.createXMLStreamReader(in);
			
			while(parser.hasNext()){
				int event = parser.next();
				if(event == XMLStreamReader.START_ELEMENT){
					if("a".equals(parser.getLocalName())){
						String href = parser.getAttributeValue(null, "href");
						if(href!=null){
							System.out.println(href);
						}
					}
				}
			}
				
		}catch(Exception e){
			e.printStackTrace();
		}
		
	}
}

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spring框架是一个非常行的Java应用程序开发框架,它提供了一系列的解决方案,包括依赖注入、面向切面编程、事务管理、Web开发、消息处理等。Spring框架的核心是IoC容器,它提供了一个容器来管理对象的生命周期和依赖关系,使得应用程序开发更加简单、灵活和可扩展。 如果你想深入了解Spring框架的实现原理,那么你需要阅读Spring源代码。Spring的源代码非常庞大,涉及的知识面也非常广泛,包括Java基础、设计模式、反射、代理、字节码操作等。以下是一些你可能需要了解的主题: 1. IoC容器的实现原理:Spring的IoC容器是整个框架的核心,它的实现依赖于Java的反射机制XML配置文件。了解Spring的IoC容器的实现原理,可以帮助你更好地理解Spring的依赖注入机制和Bean的生命周期。 2. AOP的实现原理:Spring的AOP机制是基于动态代理和字节码操作实现的,了解AOP的实现原理可以帮助你更好地理解Spring的事务管理和日志处理等方面的机制。 3. Web框架的实现原理:Spring的Web框架是基于Servlet和JSP技术实现的,它提供了一系列的解决方案,包括控制器、视图解析器、拦截器等。了解Web框架的实现原理可以帮助你更好地理解Spring的Web开发机制。 4. Spring Security的实现原理:Spring Security是一个强大的安全框架,它提供了一系列的解决方案,包括认证、授权、攻击防护等。了解Spring Security的实现原理可以帮助你更好地理解Spring的安全机制。 总之,要深入了解Spring框架的实现原理,需要具备一定的Java基础知识和相关技术的知识,同时需要花费大量的时间和精力去研究Spring的源代码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值