XML篇之XML解析

前言:

什么是xml解析

XML 解析是指对 XML 文档进行解析,从而获取文档中的数据信息的过程。

XML(Extensible Markup Language)是一种用于存储和传输数据的标记语言。它和 HTML 相似,都是用标签来描述文档内容,但 XML 更加灵活和扩展,适用于存储和传输各种结构化数据。常见的 XML 应用包括 RSS、SOAP、Atom、SVG 等。

XML 解析器是用于对 XML 文档进行解析的程序。XML 解析的方式一般有两种:DOM 解析和 SAX 解析。

DOM 解析是一种基于树形结构的解析方式,将整个 XML 文档载入内存,然后形成一个树形结构,程序员可以根据已知的路径和名称获取节点及其属性信息。

SAX 解析是一种基于事件的解析方式,它不需要将整个 XML 文档加载到内存中。在遍历 XML 文档时,SAX 解析器检测到特定的事件并触发一个回调函数,程序可以在回调函数中获得相应的节点信息和属性信息,从而实现对 XML 文档的读取。

在 Java 中,有很多常用的 XML 解析器库,例如 Java API for XML Processing (JAXP)、dom4j、JDOM 等。开发者可以根据自己的需求选择合适的解析器库,进行 XML 文档的解析和处理。

在本章节,我们使用的是dom4j解析器

dom4j 是一个开源的 Java XML API 库,用于读取、解析、创建和操作 XML 文档。与 Java 内置的 SAX 和 DOM 解析器相比,dom4j 具有更好的性能和易用性,在大型 XML 数据处理方面更加优秀。它提供了许多方便的 API 和工具,使得 XML 文档的处理更加简单和灵活。

dom4j 提供了完整的 SAX2 和 DOM4 API 接口,也提供了一种更好的标准 API 接口——Document Object Model (DOM)。相对于其他 Java XML 库,dom4j 使用更容易和灵活,同时具有更好的性能和更低的内存开销。它支持将 XML 文档解析成树状结构,使用 XPath、XSLT 等方式对文档进行查询和转换,也支持文档的序列化和反序列化为 XML 字符串或流。

dom4j 已被广泛应用于许多 WEB 开发、企业应用和桌面应用中,也是 Apache Struts 和 Hibernate 等框架的基础库。

如果需要了解dom4j的常用方法,个人建议使用国内的chatgpt镜像网站会有更加详细的解析,本章节使用到了其中的一些方法可做参考


目录

前言:

1:各个位置下的资源文件的读取方式

1.1:同包目录下的读取文件方式(.properties文件)

1.2:同包目录下的读取文件方式(.xml文件)

1.3:获取不同包的文件信息

1.4:获取安全目录下的文件信息(web-inf)

2:xpath解析

2.1:什么是xpath


1:各个位置下的资源文件的读取方式

  • 同包下获取文件信息
  • 不同包下获取文件信息
  • 获取安全目录下的文件信息

1.1:同包目录下的读取文件方式(.properties文件)

InputStream in = demo1.class.getResourceAsStream("config.properties");

//实例化工具类
properties p = new properties();
//使用工具类中的方法加载文件
p.load(in);
System.out.println(p.getProperty("url"));

p.load(in)Properties 类中的一个方法,它可以从一个输入流中加载键值对数据,并将其存储到一个 Properties 对象中。通常,输入流中保存的是一个属性文件(例如"*.properties"),其中包含了一系列的属性和值。

在上面的代码中,使用了一个 InputStream 类型的变量 in 进行了加载操作。调用 p.load(in) 方法后,会将 in 中的属性文件内容加载到 Properties 对象 p 中。接着使用 p.getProperty(“url”) 可以根据 key 获取对应的 value(即获取“url”这个键对应的值)。如果属性文件包含了多组键值对,都会被加载到 p 中,可以通过调用相应的方法获取指定 key 的值。

1.2:同包目录下的读取文件方式(.xml文件)

//获取xml文件信息
InputStream in1 = demo1.class.getResourceAsStream("students.xml");
//实例化   SAXReader 是 dom4j 提供的用于解析 XML 文件的工具类
SAXReader s= new SAXReader();
try{
//调用工具类中的read方法
	Document read = s.read(in1);
//拿到xml文件的所有信息
			System.out.println(read.asXML());
//			Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
     		System.out.println(node2.getText());
	//拿到Students.xml中student下的信息
			List<Element> selectNodes = read.selectNodes("/students/student");
		for (Element element : selectNodes) {
			//注意这里一定要asxml,否则出来的应该是文件的内存地址的信息
//			System.out.println(element.asXML());
			//拿到students下面的那么节点
		
			 Element node = (Element) element.selectSingleNode("name");
			//拿到所有的name节点信息
			System.out.println(node.asXML());
			//拿到name节点中的文本信息
			System.out.println(node.getText());
			//拿到student节点中的id信息
			System.out.println(element.attributeValue("sid"));
			//只拿到sid为3的的name
		if("s003".equals(element.attributeValue("sid"))) {
				System.out.println(element.selectSingleNode("name").getText());
			}
}catch{
	e.printStackTrace();
}

1.3:获取不同包的文件信息

        //获取不同包下面的文件信息 主要是改路劲那里价格/就可以了
		InputStream in2 = demo1.class.getResourceAsStream("/students.xml");
		SAXReader ss= new SAXReader();
		try {
			Document read = ss.read(in2);
			List<Element> node = read.selectNodes("/students");
			for (Element element : node) {
				System.out.println(element.asXML());
			}
		} catch (DocumentException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}

1.4:获取安全目录下的文件信息(web-inf)

在Java Web应用程序中,WEB-INF 目录是受保护的目录,可以存放配置文件和其他敏感数据,不能直接访问。可以通过 ServletContext 对象获取 WEB-INF 目录下的文件,通过使用 getResourceAsStream() 方法将文件读入 InputStream 对象中,以进行文件操作,这可以保证 WEB-INF 目录下的文件的安全性。

ServletContext 对象是 Web 应用程序的上下文,包含 Web 应用程序的全局信息。应用程序部署时,创建一个 ServletContext 对象,表示整个 Web 应用程序的上下文,其中包含了该 Web 应用程序的配置信息、能够访问的资源列表等。使用 ServletContext 对象可以访问 Web 应用程序中的任何资源,包括磁盘上的文件以及在 Web 应用程序内部和外部存储的数据。

此时我把文件放在安全目录下去进行访问

看代码

package Servlet;

import java.io.IOException;
import java.io.InputStream;

import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

@WebServlet("/oneSerlvet")
public class oneSerlvet extends HttpServlet {
	protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
	doPost(request, response);
	}

	protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
	
		//获取web-inf目录下的文件信息
		InputStream in = getServletContext().getResourceAsStream("/WEB-INF/students.xml");
		
		SAXReader s= new SAXReader();
		try {
			Document read = s.read(in);
			System.out.println(read.asXML());
		} catch (DocumentException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	
	}

}

 看看打印结果

这样,我们就已经拿到xml的整个文件的信息啦

2:xpath解析

2.1:什么是xpath

XPath (XML Path Language)是一种基于 XML 结构的查询语言,它使用路径表达式来描述和定位 XML 文档中的元素。XPath 是由 W3C 推荐的标准,被广泛应用于 XML 文档的解析、查询和操作。

通过 XPath 可以简化 XML 文档内部节点的查找。使用 XPath 可以通过指定节点路径来定位文档中的某个节点或一组节点。因此,XPath 解析可用于快速、方便地解析和处理 XML 文档。XPath 也可用于快速查找和过滤非常大的XML文件中的数据。

简单来说:我们通常拿到指定节点的信息,需要通过层层的循环,然后遍历判断,才能够拿到我们想要的数据,但是如果配置信息中的层级过多,就会很麻烦,于是就出现了通过xpath去拿到元素信息的方式

举个例子,这里是我们的xml配置文件信息

现在我们通过xpath要拿到sid为s003中的name节点的文本信息 

//通过xpath解析法直接拿到指定的文件信息
//			Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
//			System.out.println(node2.getText());

这就是今天的全部内容啦!感谢观看

 

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值