XML解析模型

最新推荐文章于 2020-06-26 10:47:58 发布

JDIT

最新推荐文章于 2020-06-26 10:47:58 发布

阅读量267

点赞数

分类专栏： Java Web

本文链接：https://blog.csdn.net/weixin_38280568/article/details/104469258

版权

Java Web 专栏收录该内容

107 篇文章 0 订阅

订阅专栏

回到首页☞

若要操作XML文档，读取或者修改其中的数据信息，就要先解析XML文档，因此就需要写一些程序来对XML文件进行解析，并称这些程序为XML解析器。
XML文档最基本的解析方式有两种，分别是文档对象模型 Document Object Model简称DOM 和XML解析的简单API SAX。

1 DOM 解析

DOM解析Document Object Mode 是一种基于对象的API，它把XML的内容加载到内存中，生成一个与XML文档内容对应的对象模型。当解析完成时，内存中会生成与XML文档的结构对应的DOM对象树。这样便能够根据树的结构，以节点形式来对文档进行操作。解析XML文件要比解析字符串，解析properties文件复杂的多，需要构建不止一个工具类对象。

package com.wht.demo.util;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;

/**
 * @author JDIT
 */
public class DomDemo {
  public static void main(String[] args) {
    // 要解析文件
    File xmlFile = new File("D:\\workspace\\idea\\HelloWorld\\web\\WEB-INF\\web.xml");


    DocumentBuilder builder = null;

    DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

    try {
      builder = builderFactory.newDocumentBuilder();

      Document document = builder.parse(xmlFile);

      Element root = document.getDocumentElement();

      System.out.println("根元素：" + root.getNodeName());
      NodeList childNodes = root.getChildNodes();

      for (int i = 0; i < childNodes.getLength(); i++) {
        Node node = childNodes.item(i);
        NodeList childNodess = root.getChildNodes();
        for (int k = 0; k < childNodess.getLength(); k++) {
          Node nodes = childNodess.item(k);
          NodeList b = root.getChildNodes();
          if(!"#text".equals(nodes.getNodeName())){
            System.out.println(">>>\t" + nodes.getNodeName());
          }
          if("display-name".equals(nodes.getNodeName())){
            System.out.println(">>>\t" + nodes.getTextContent());
          }


        }
      }

    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }


    System.out.println(xmlFile.length());
  }
}

这只是简单的认识下，其实这里有个问题，因为回车符导致解析有很多#text标签。

2 SAX 解析

解析XML还有一种选择就是SAX解析，DOM面对大文件映射到内存消耗较大。
SAX解析器会对XML文档解析从XML文档开始位置起进行解析，同时根据已经定义好的事件处理器，来决定当前所解析的部分是否有必要记录并存储。

package com.wht.demo.xml;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
import java.io.IOException;
import java.text.DateFormat;
import java.text.SimpleDateFormat;

/**
 * SAX解析监听器
 * @author JDIT
 */
public class MySaxHandler extends DefaultHandler {
  private final DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

  private String content;

  /**
   * 事件发生时元素中的字符
   * @param ch
   * @param start
   * @param length
   * @throws SAXException
   */
  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    this.content = new String(ch,start,length);
  }

  /**
   * 当解析到元素的结束标签时触发
   * @param uri
   * @param localName
   * @param qName
   * @throws SAXException
   */
  @Override
  public void endElement(String uri, String localName, String qName) throws SAXException {
    if("servlet-class".equals(qName)){
      System.out.println("endElement:servlet-class:"+content);
    }
  }

  /**
   * 解析到元素的开始标签时触发
   * @param uri
   * @param localName
   * @param qName
   * @param attributes
   * @throws SAXException
   */
  @Override
  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    if("web-app".equals(qName)){
      System.out.println("startElement:web-app:xmlns:"+attributes.getValue("xmlns"));
    }
  }

  public static void main(String[] args) {
    // 要解析文件
    File xmlFile = new File("D:\\workspace\\idea\\HelloWorld\\web\\WEB-INF\\web.xml");
    SAXParserFactory factory = SAXParserFactory.newInstance();
    try {
      SAXParser parser = factory.newSAXParser();
      parser.parse(xmlFile,new MySaxHandler());
    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}