XML 解析(dom/sax, dom4j)

最新推荐文章于 2024-10-09 15:12:06 发布

Coding Diary

最新推荐文章于 2024-10-09 15:12:06 发布

阅读量209

点赞数

分类专栏： xml 文章标签： xml

本文链接：https://blog.csdn.net/qq_36414013/article/details/56508689

版权

xml 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

JAXP解析
 JAXP 是sun公司推出的一套解析XML文档的API，该API是J2SE的一部分，它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成

 JAXP支持两种方式(DOM和SAX)对XML文档进行解析，两种方式思路类似，都需要通过调用工厂类得方法来获得解析器，进而通过解析器对文档进行解析

boo.xml :

<?xml version="1.0" encoding="UTF-8"?>

<书架> 
  <书> 
    <书名>Java核心技术</书名>  
    <作者 id="ccc">Gary</作者>  
    <售价>39.00元</售价> 
  </书>  
  <书> 
    <书名>JavaScript网页开发</书名>  
    <作者>Tom</作者>  
    <售价>28.00元</售价>  
    <出版社 name="xxxx" id="111" location="北京">人民出版社</出版社>
  </书> 
</书架>

Dom解析
 处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的，这种结构占用的内存较多，而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问

package  com.my.xml.jaxp;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo1 {
	
	public static void main(String[] args) throws Exception {
		// 1. 创建工厂对象
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		// 2. 实例化解析器对象
		DocumentBuilder builder = factory.newDocumentBuilder();
		// 3. 解析xml文档  获得Document
		Document document = builder.parse("src/book.xml");
		// 4. 通过Document去获得指定的元素
		// 读取第一本书的书名
		NodeList nodeList = document.getElementsByTagName("书");
		Node bookNode = nodeList.item(0);
		Node textNode = bookNode.getFirstChild();
		Node booknameNode = textNode.getNextSibling();
		String data = booknameNode.getTextContent();
		System.out.println(data);
		// 根据id 获得节点
		Element element = document.getElementById("aa");
		System.out.println(element.getTagName());
	}
	
}

Sax解析
SAX是事件驱动型的XML解析方式。它顺序读取XML文件，不需要一次全部装载整个文件。当遇到像文件开头，文档结束，或者标签开头与标签结束时，它会触发一个事件，用户通过在其回调事件中写入处理代码来处理XML文件，适合对XML的顺序访问

Sax实例1：

package  com.my.xml.jaxp;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;


//sax 解析
public class Demo2 {

	public static void main(String[] args) throws Exception{
		// 创建工厂
		SAXParserFactory  factory = SAXParserFactory.newInstance();
		// 创建解析器
		SAXParser parser = factory.newSAXParser();
		// 通过解析器获得内部读取器
		XMLReader reader = parser.getXMLReader();
		// 绑定内容处理器
		reader.setContentHandler(new MyContentHandler());
		// 读取xml文件
		reader.parse("src/book.xml");
		
	}
	
}

class MyContentHandler implements ContentHandler {

	@Override
	public void setDocumentLocator(Locator locator) {
		// TODO Auto-generated method stub
	}

	@Override
	public void startDocument() throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void endDocument() throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void startPrefixMapping(String prefix, String uri)
			throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void endPrefixMapping(String prefix) throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes atts) throws SAXException {
		System.out.println("<" + qName + ">");
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		System.out.println("</" + qName + ">");
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		System.out.println(new String(ch, start, length));
	}

	@Override
	public void ignorableWhitespace(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void processingInstruction(String target, String data)
			throws SAXException {
		// TODO Auto-generated method stub
	}

	@Override
	public void skippedEntity(String name) throws SAXException {
		// TODO Auto-generated method stub
	}
	
}

Sax实例2:

package  com.my.xml.jaxp;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class Demo3 {

	/**
	 * @param args
	 */
	public static void main(String[] args) throws Exception {
		// 读取第一本书的价格
		SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
		XMLReader reader = parser.getXMLReader();
		reader.setContentHandler(new MyContentHandler1());
		reader.parse("src/book.xml");
	}

}

class MyContentHandler1 extends DefaultHandler {
	
	private boolean test = false;
	private int num = 1;
	
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		if("售价".equals(qName)) {
			test = true;
		}
	}
	
	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		if("售价".equals(qName)) {
			test = false;
			num++;
		}
	}
	
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		if(test && num==2) {
			String data = new String(ch, start, length);
			
			System.out.println(data);
		}
	}
	
}

2.Dom4j解析
 Dom4j是一个非常优秀的Java XML API，具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j。

jar包：dom4j-1.6.1.jar，jaxen-1.1-beta-6.jar

package com.my.xml.dom4j;

import java.io.FileOutputStream;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

public class Dom4jTest {

	@Test
	public void test1() throws Exception {
		// 读第二本书的书名
		// 加载文档
		Document document = parse();
		// 获得根元素
		Element root = document.getRootElement();
		//Element bookElement = root.element("书");
		Element bookElement = (Element) root.elements("书").get(1);
		Element booknameElement = bookElement.element("书名");
		String text = booknameElement.getText();
		System.out.println(text);
	}
	
	@Test
	public void test2() throws Exception {
		// 加载文档
		Document document = parse();
		// 删除第一本书的第二个售价
		// 获得
		Element rootElement = document.getRootElement();
		Element bookElement = rootElement.element("书");
		Element priceElement = (Element) bookElement.elements("售价").get(1);
		// 删除
		bookElement.remove(priceElement);
		// 写入文档
		write2Xml(document);
	}
	
	@Test
	public void test3() throws Exception {
		// 加载文档
		Document document = parse();
		// 第一本书的作者的id修改为cc
		// 获得
		Element rootElement = document.getRootElement();
		Element authorElement = rootElement.element("书").element("作者");
		// 修改
		authorElement.addAttribute("id", "ccc");
		// 写入文档
		write2Xml(document);
	}
	
	@Test
	public void test4() throws Exception {
		// 加载文档
		Document document = parse();
		// 为第二本书添加一个出版社子节点
		// 获得
		Element rootElement = document.getRootElement();
		Element bookElement = (Element) rootElement.elements("书").get(1);
		// 添加
		bookElement.addElement("出版社")
				.addAttribute("name", "xxxx")
				.addAttribute("id", "111")
				.addAttribute("location", "北京")
				.addText("人民出版社");
		
		// 写入文档
		write2Xml(document);
	}
	
	private void write2Xml(Document document) throws Exception {
		 OutputFormat format = OutputFormat.createPrettyPrint();
		 XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format );
	     writer.write( document );
	     writer.close();
	}

	// 解析 xml
	public Document parse() throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read("src/book.xml");
        return document;
    }
	
}

Coding Diary