xml的解析（dom 解析 jaxp ）

最新推荐文章于 2023-06-19 16:47:21 发布

大阳彼岸

最新推荐文章于 2023-06-19 16:47:21 发布

阅读量152

点赞数

分类专栏：【xml schema dom4j log4j】【操作，解析】

【操作，解析】同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

【xml schema dom4j log4j】

8 篇文章 0 订阅

订阅专栏

xml的解析的简介（写到java代码）
   * xml是标记型文档
   * js使用dom解析标记型文档？
       - 根据html的层级结构，在内存中分配一个树形结构，把html的标签，属性和文本都封装成对象
       - document对象、element对象、属性对象、文本对象、Node节点对象

   * xml的解析方式（技术）：dom 和 sax
       ** 画图分析使用dom和sax解析xml过程

       dom解析和sax解析区别：
         dom方式解析
             根据xml的层级结构在内存中分配一个树形结构，把xml的标签，属性和文本都封装成对象
             缺点：如果文件过大，造成内存溢出
             优点：很方便实现增删改操作

         sax方式解析
             采用事件驱动，边读边解析
                - 从上到下，一行一行的解析，解析到某一个对象，返回对象名称
             缺点：不能实现增删改操作
             优点：如果文件过大，不会造成内存溢出，方便实现查询操作

     想要解析xml，首先需要解析器
     不同的公司和组织提供了针对dom和sax方式的解析器，通过api方式提供
     sun公司提供了针对dom和sax解析器 jaxp
     dom4j组织，针对dom和sax解析器    dom4j（实际开发中用的最多的）
     jdom组织，针对dom和sax解析器     jdom

-----------jaxp------------

jaxp是javase的一部分 jaxp解析器在jdk的javax.xml.parsers包里面
四个类：分别是针对dom和sax解析使用的类

         dom：
            DocumentBuilder : 解析器类
                - 这个类是一个抽象类，不能new，
                此类的实例可以从 DocumentBuilderFactory.newDocumentBuilder() 方法获取

                - 一个方法，可以解析xml parse("xml路径") 返回是 Document 整个文档
                - 返回的document是一个接口，父节点是Node，如果在document里面找不到想要的方法，到Node里面去找

                - 在document里面方法
                    getElementsByTagName(String tagname)
                    -- 这个方法可以得到标签
                    -- 返回集合 NodeList

createElement(String tagName)
-- 创建标签

createTextNode(String data)
-- 创建文本

appendChild(Node newChild)
-- 把文本添加到标签下面

removeChild(Node oldChild) 只能是父节点才能操作
-- 删除节点

getParentNode()
-- 获取父节点

                    NodeList list
                    - getLength() 得到集合的长度
                    - item(int index)下标取到具体的值
                    for(int i=0;i<list.getLength();i++) {
                        list.item(i)
                    }

                    getTextContent()
                    - 得到标签里面的内容

            DocumentBuilderFactory：解析器工厂
                - 这个类也是一个抽象类，不能new
                newInstance() 获取 DocumentBuilderFactory 的实例。

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<person>
	<p1>
		<name>zhangsan</name>
		<age>20</age>	
	</p1>
	<p1>
		<name>lisi</name>
		<age>30</age>
	</p1>
</person>

package cn.itcast.jaxptest;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException;

/**
 * 实现jaxp操作xml
 * @author asus
 *
 */
public class TestJaxp {

	public static void main(String[] args) throws Exception {
		//selectAll();
		//selectSin();
		//addSex();
		//modifySex();
		//delSex();
		listElement();
	}

	//遍历节点，把所有元素名称打印出来
	public static void listElement() throws Exception {
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml，返回document
		 * 
		 * ====使用递归实现=====
		 * 4、得到根节点
		 * 5、得到根节点子节点
		 * 6、得到根节点子节点的子节点
		 * */
		//创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//得到document
		Document document = builder.parse("src/person.xml");
		
		//编写一个方法实现遍历操作
		list1(document);
	}
	
	//递归遍历的方法
	private static void list1(Node node) {
		//判断是元素类型时候才打印
		if(node.getNodeType() == Node.ELEMENT_NODE) {			
			System.out.println(node.getNodeName());
		}
		
		//得到一层子节点
		NodeList list = node.getChildNodes();
		//遍历list
		for(int i=0;i<list.getLength();i++) {
			//得到每一个节点
			Node node1 = list.item(i);
			//继续得到node1的子节点
			//node1.getChildNodes()
			list1(node1);
		}
	}

	//删除<sex>nan</sex>节点
	public static void delSex() throws Exception {
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml，返回document 
		 * 
		 * 4、获取sex元素
		 * 5、获取sex的父节点 
		 * 6、删除使用父节点删除 removeChild方法
		 * 
		 * 7、回写xml
		 * */
		//创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//得到document
		Document document = builder.parse("src/person.xml");
		//得到sex元素
		Node sex1 = document.getElementsByTagName("sex").item(0);
		//得到sex1父节点
		Node p1 = sex1.getParentNode();
		//删除操作
		p1.removeChild(sex1);
		//回写xml
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		transformer.transform(new DOMSource(document), new StreamResult("src/person.xml"));
	}
	
	//修改第一个p1下面的sex内容是nan
	public static void modifySex() throws Exception {
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml，返回document 
		 * 
		 * 4、得到sex item方法
		 * 5、修改sex里面的值  setTextContent方法
		 * 
		 * 6、回写xml
		 * */
		//创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//得到document
		Document document = builder.parse("src/person.xml");
		
		//得到sex
		Node sex1 = document.getElementsByTagName("sex").item(0);
		//修改sex值
		sex1.setTextContent("nan");
		//回写xml
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		transformer.transform(new DOMSource(document), new StreamResult("src/person.xml"));
	}
	
	//在第一个p1下面（末尾）添加 <sex>nv</sex>
	public static void addSex() throws Exception {
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml，返回document
		 * 
		 * 4、得到第一个p1
		 * 	- 得到所有p1，使用item方法下标得到
		 * 5、创建sex标签 createElement
		 * 6、创建文本 createTextNode
		 * 7、把文本添加到sex下面 appendChild
		 * 8、把sex添加到第一个p1下面
		 * 
		 * 9、回写xml
		 * */
		//创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//得到document
		Document document = builder.parse("src/person.xml");
		
		//得到所有的p1
		NodeList list = document.getElementsByTagName("p1");
		//得到第一个p1
		Node p1 = list.item(0);
		//创建标签
		Element sex1 = document.createElement("sex");
		//创建文本
		Text text1 = document.createTextNode("nv");
		//把文本添加到sex1下面
		sex1.appendChild(text1);
		//把sex1添加到p1下面
		p1.appendChild(sex1);
		//回写xml
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		transformer.transform(new DOMSource(document), new StreamResult("src/person.xml"));	
	}
	
	//查询xml中第一个name元素的值
	public static void selectSin() throws Exception {
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml，返回document
		 * 
		 * 4、得到所有name元素
		 * 5、使用返回集合，里面方法 item，下标获取具体的元素
		 * 6、得到具体的值，使用 getTextContent方法
		 * 
		 * */
		//创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//解析xml，得到document
		Document document = builder.parse("src/person.xml");
		//得到所有的name元素
		NodeList list = document.getElementsByTagName("name");
		//使用下标 得到第一个元素
		Node name1 = list.item(1);
		//得到name里面的具体的值
		String s1 = name1.getTextContent();
		System.out.println(s1);
	}
	
	//查询所有name元素的值
	private static void selectAll() throws Exception {
		//查询所有name元素的值
		/*
		 * 1、创建解析器工厂
		 * 2、根据解析器工厂创建解析器
		 * 3、解析xml返回document
		 *  
		 * 4、得到所有的name元素
		 * 5、返回集合，遍历集合，得到每一个name元素
		 * */
		//创建解析器工厂    atl / : 代码提示
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		//创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		//解析xml返回document
		Document document = builder.parse("src/person.xml");
		//得到name元素
		NodeList list = document.getElementsByTagName("name");
		//遍历集合
		for(int i=0;i<list.getLength();i++) {
			Node name1 = list.item(i); //得到每一个name元素
			//得到name元素里面的值
			String s = name1.getTextContent();
			System.out.println(s);
		}
	}

}