XML解析模型

回到首页☞

若要操作XML文档,读取或者修改其中的数据信息,就要先解析XML文档,因此就需要写一些程序来对XML文件进行解析,并称这些程序为XML解析器。
XML文档最基本的解析方式有两种,分别是文档对象模型 Document Object Model简称DOM 和XML解析的简单API SAX。

1 DOM 解析

DOM解析Document Object Mode 是一种基于对象的API,它把XML的内容加载到内存中,生成一个与XML文档内容对应的对象模型。当解析完成时,内存中会生成与XML文档的结构对应的DOM对象树。这样便能够根据树的结构,以节点形式来对文档进行操作。解析XML文件要比解析字符串,解析properties文件复杂的多,需要构建不止一个工具类对象。

package com.wht.demo.util;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;

/**
 * @author JDIT
 */
public class DomDemo {
  public static void main(String[] args) {
    // 要解析文件
    File xmlFile = new File("D:\\workspace\\idea\\HelloWorld\\web\\WEB-INF\\web.xml");


    DocumentBuilder builder = null;

    DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

    try {
      builder = builderFactory.newDocumentBuilder();

      Document document = builder.parse(xmlFile);

      Element root = document.getDocumentElement();

      System.out.println("根元素:" + root.getNodeName());
      NodeList childNodes = root.getChildNodes();

      for (int i = 0; i < childNodes.getLength(); i++) {
        Node node = childNodes.item(i);
        NodeList childNodess = root.getChildNodes();
        for (int k = 0; k < childNodess.getLength(); k++) {
          Node nodes = childNodess.item(k);
          NodeList b = root.getChildNodes();
          if(!"#text".equals(nodes.getNodeName())){
            System.out.println(">>>\t" + nodes.getNodeName());
          }
          if("display-name".equals(nodes.getNodeName())){
            System.out.println(">>>\t" + nodes.getTextContent());
          }


        }
      }

    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }


    System.out.println(xmlFile.length());
  }
}

这只是简单的认识下,其实这里有个问题,因为回车符导致解析有很多#text标签。

2 SAX 解析

解析XML还有一种选择就是SAX解析,DOM面对大文件映射到内存消耗较大。
SAX解析器会对XML文档解析从XML文档开始位置起进行解析,同时根据已经定义好的事件处理器,来决定当前所解析的部分是否有必要记录并存储。

package com.wht.demo.xml;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
import java.io.IOException;
import java.text.DateFormat;
import java.text.SimpleDateFormat;

/**
 * SAX解析监听器
 * @author JDIT
 */
public class MySaxHandler extends DefaultHandler {
  private final DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

  private String content;

  /**
   * 事件发生时元素中的字符
   * @param ch
   * @param start
   * @param length
   * @throws SAXException
   */
  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    this.content = new String(ch,start,length);
  }

  /**
   * 当解析到元素的结束标签时触发
   * @param uri
   * @param localName
   * @param qName
   * @throws SAXException
   */
  @Override
  public void endElement(String uri, String localName, String qName) throws SAXException {
    if("servlet-class".equals(qName)){
      System.out.println("endElement:servlet-class:"+content);
    }
  }

  /**
   * 解析到元素的开始标签时触发
   * @param uri
   * @param localName
   * @param qName
   * @param attributes
   * @throws SAXException
   */
  @Override
  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    if("web-app".equals(qName)){
      System.out.println("startElement:web-app:xmlns:"+attributes.getValue("xmlns"));
    }
  }

  public static void main(String[] args) {
    // 要解析文件
    File xmlFile = new File("D:\\workspace\\idea\\HelloWorld\\web\\WEB-INF\\web.xml");
    SAXParserFactory factory = SAXParserFactory.newInstance();
    try {
      SAXParser parser = factory.newSAXParser();
      parser.parse(xmlFile,new MySaxHandler());
    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

确实更加好用,至于怎么实现的,这个事件怎么 做到的,在内核中。

回到首页☞

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值