XML篇之XML解析

最新推荐文章于 2025-02-17 22:09:29 发布

文昊桑

最新推荐文章于 2025-02-17 22:09:29 发布

阅读量1.8k

点赞数 2

文章标签： xml java servlet

本文链接：https://blog.csdn.net/m0_73329959/article/details/131288900

版权

前言：

什么是xml解析

XML 解析是指对 XML 文档进行解析，从而获取文档中的数据信息的过程。

XML（Extensible Markup Language）是一种用于存储和传输数据的标记语言。它和 HTML 相似，都是用标签来描述文档内容，但 XML 更加灵活和扩展，适用于存储和传输各种结构化数据。常见的 XML 应用包括 RSS、SOAP、Atom、SVG 等。

XML 解析器是用于对 XML 文档进行解析的程序。XML 解析的方式一般有两种：DOM 解析和 SAX 解析。

DOM 解析是一种基于树形结构的解析方式，将整个 XML 文档载入内存，然后形成一个树形结构，程序员可以根据已知的路径和名称获取节点及其属性信息。

SAX 解析是一种基于事件的解析方式，它不需要将整个 XML 文档加载到内存中。在遍历 XML 文档时，SAX 解析器检测到特定的事件并触发一个回调函数，程序可以在回调函数中获得相应的节点信息和属性信息，从而实现对 XML 文档的读取。

在 Java 中，有很多常用的 XML 解析器库，例如 Java API for XML Processing (JAXP)、dom4j、JDOM 等。开发者可以根据自己的需求选择合适的解析器库，进行 XML 文档的解析和处理。

在本章节，我们使用的是dom4j解析器

dom4j 是一个开源的 Java XML API 库，用于读取、解析、创建和操作 XML 文档。与 Java 内置的 SAX 和 DOM 解析器相比，dom4j 具有更好的性能和易用性，在大型 XML 数据处理方面更加优秀。它提供了许多方便的 API 和工具，使得 XML 文档的处理更加简单和灵活。

dom4j 提供了完整的 SAX2 和 DOM4 API 接口，也提供了一种更好的标准 API 接口——Document Object Model (DOM)。相对于其他 Java XML 库，dom4j 使用更容易和灵活，同时具有更好的性能和更低的内存开销。它支持将 XML 文档解析成树状结构，使用 XPath、XSLT 等方式对文档进行查询和转换，也支持文档的序列化和反序列化为 XML 字符串或流。

dom4j 已被广泛应用于许多 WEB 开发、企业应用和桌面应用中，也是 Apache Struts 和 Hibernate 等框架的基础库。

如果需要了解dom4j的常用方法，个人建议使用国内的chatgpt镜像网站会有更加详细的解析，本章节使用到了其中的一些方法可做参考

前言：

1：各个位置下的资源文件的读取方式

1.1：同包目录下的读取文件方式（.properties文件）

1.2：同包目录下的读取文件方式（.xml文件）

1.3：获取不同包的文件信息

1.4：获取安全目录下的文件信息（web-inf）

2：xpath解析

2.1：什么是xpath

1：各个位置下的资源文件的读取方式

同包下获取文件信息
不同包下获取文件信息
获取安全目录下的文件信息

1.1：同包目录下的读取文件方式（.properties文件）

InputStream in = demo1.class.getResourceAsStream("config.properties");

//实例化工具类
properties p = new properties();
//使用工具类中的方法加载文件
p.load(in);
System.out.println(p.getProperty("url"));

p.load(in)是 Properties 类中的一个方法，它可以从一个输入流中加载键值对数据，并将其存储到一个 Properties 对象中。通常，输入流中保存的是一个属性文件（例如"*.properties"），其中包含了一系列的属性和值。

在上面的代码中，使用了一个 InputStream 类型的变量 in 进行了加载操作。调用 p.load(in) 方法后，会将 in 中的属性文件内容加载到 Properties 对象 p 中。接着使用 p.getProperty(“url”) 可以根据 key 获取对应的 value（即获取“url”这个键对应的值）。如果属性文件包含了多组键值对，都会被加载到 p 中，可以通过调用相应的方法获取指定 key 的值。

1.2：同包目录下的读取文件方式（.xml文件）

//获取xml文件信息
InputStream in1 = demo1.class.getResourceAsStream("students.xml");
//实例化   SAXReader 是 dom4j 提供的用于解析 XML 文件的工具类
SAXReader s= new SAXReader();
try{
//调用工具类中的read方法
	Document read = s.read(in1);
//拿到xml文件的所有信息
			System.out.println(read.asXML());
//			Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
     		System.out.println(node2.getText());
	//拿到Students.xml中student下的信息
			List<Element> selectNodes = read.selectNodes("/students/student");
		for (Element element : selectNodes) {
			//注意这里一定要asxml，否则出来的应该是文件的内存地址的信息
//			System.out.println(element.asXML());
			//拿到students下面的那么节点
		
			 Element node = (Element) element.selectSingleNode("name");
			//拿到所有的name节点信息
			System.out.println(node.asXML());
			//拿到name节点中的文本信息
			System.out.println(node.getText());
			//拿到student节点中的id信息
			System.out.println(element.attributeValue("sid"));
			//只拿到sid为3的的name
		if("s003".equals(element.attributeValue("sid"))) {
				System.out.println(element.selectSingleNode("name").getText());
			}
}catch{
	e.printStackTrace();
}

1.3：获取不同包的文件信息

        //获取不同包下面的文件信息 主要是改路劲那里价格/就可以了
		InputStream in2 = demo1.class.getResourceAsStream("/students.xml");
		SAXReader ss= new SAXReader();
		try {
			Document read = ss.read(in2);
			List<Element> node = read.selectNodes("/students");
			for (Element element : node) {
				System.out.println(element.asXML());
			}
		} catch (DocumentException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}

1.4：获取安全目录下的文件信息（web-inf）

在Java Web应用程序中，WEB-INF 目录是受保护的目录，可以存放配置文件和其他敏感数据，不能直接访问。可以通过 ServletContext 对象获取 WEB-INF 目录下的文件，通过使用 getResourceAsStream() 方法将文件读入 InputStream 对象中，以进行文件操作，这可以保证 WEB-INF 目录下的文件的安全性。

ServletContext 对象是 Web 应用程序的上下文，包含 Web 应用程序的全局信息。应用程序部署时，创建一个 ServletContext 对象，表示整个 Web 应用程序的上下文，其中包含了该 Web 应用程序的配置信息、能够访问的资源列表等。使用 ServletContext 对象可以访问 Web 应用程序中的任何资源，包括磁盘上的文件以及在 Web 应用程序内部和外部存储的数据。

此时我把文件放在安全目录下去进行访问

看代码

package Servlet;

import java.io.IOException;
import java.io.InputStream;

import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

@WebServlet("/oneSerlvet")
public class oneSerlvet extends HttpServlet {
	protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
	doPost(request, response);
	}

	protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
	
		//获取web-inf目录下的文件信息
		InputStream in = getServletContext().getResourceAsStream("/WEB-INF/students.xml");
		
		SAXReader s= new SAXReader();
		try {
			Document read = s.read(in);
			System.out.println(read.asXML());
		} catch (DocumentException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	
	}

}

看看打印结果

这样，我们就已经拿到xml的整个文件的信息啦

2：xpath解析

2.1：什么是xpath

XPath （XML Path Language）是一种基于 XML 结构的查询语言，它使用路径表达式来描述和定位 XML 文档中的元素。XPath 是由 W3C 推荐的标准，被广泛应用于 XML 文档的解析、查询和操作。

通过 XPath 可以简化 XML 文档内部节点的查找。使用 XPath 可以通过指定节点路径来定位文档中的某个节点或一组节点。因此，XPath 解析可用于快速、方便地解析和处理 XML 文档。XPath 也可用于快速查找和过滤非常大的XML文件中的数据。

简单来说：我们通常拿到指定节点的信息，需要通过层层的循环，然后遍历判断，才能够拿到我们想要的数据，但是如果配置信息中的层级过多，就会很麻烦，于是就出现了通过xpath去拿到元素信息的方式

举个例子，这里是我们的xml配置文件信息

现在我们通过xpath要拿到sid为s003中的name节点的文本信息

//通过xpath解析法直接拿到指定的文件信息
//			Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
//			System.out.println(node2.getText());

这就是今天的全部内容啦！感谢观看