前言:
什么是xml解析
XML 解析是指对 XML 文档进行解析,从而获取文档中的数据信息的过程。
XML(Extensible Markup Language)是一种用于存储和传输数据的标记语言。它和 HTML 相似,都是用标签来描述文档内容,但 XML 更加灵活和扩展,适用于存储和传输各种结构化数据。常见的 XML 应用包括 RSS、SOAP、Atom、SVG 等。
XML 解析器是用于对 XML 文档进行解析的程序。XML 解析的方式一般有两种:DOM 解析和 SAX 解析。
DOM 解析是一种基于树形结构的解析方式,将整个 XML 文档载入内存,然后形成一个树形结构,程序员可以根据已知的路径和名称获取节点及其属性信息。
SAX 解析是一种基于事件的解析方式,它不需要将整个 XML 文档加载到内存中。在遍历 XML 文档时,SAX 解析器检测到特定的事件并触发一个回调函数,程序可以在回调函数中获得相应的节点信息和属性信息,从而实现对 XML 文档的读取。
在 Java 中,有很多常用的 XML 解析器库,例如 Java API for XML Processing (JAXP)、dom4j、JDOM 等。开发者可以根据自己的需求选择合适的解析器库,进行 XML 文档的解析和处理。
在本章节,我们使用的是dom4j解析器
dom4j 是一个开源的 Java XML API 库,用于读取、解析、创建和操作 XML 文档。与 Java 内置的 SAX 和 DOM 解析器相比,dom4j 具有更好的性能和易用性,在大型 XML 数据处理方面更加优秀。它提供了许多方便的 API 和工具,使得 XML 文档的处理更加简单和灵活。
dom4j 提供了完整的 SAX2 和 DOM4 API 接口,也提供了一种更好的标准 API 接口——Document Object Model (DOM)。相对于其他 Java XML 库,dom4j 使用更容易和灵活,同时具有更好的性能和更低的内存开销。它支持将 XML 文档解析成树状结构,使用 XPath、XSLT 等方式对文档进行查询和转换,也支持文档的序列化和反序列化为 XML 字符串或流。
dom4j 已被广泛应用于许多 WEB 开发、企业应用和桌面应用中,也是 Apache Struts 和 Hibernate 等框架的基础库。
如果需要了解dom4j的常用方法,个人建议使用国内的chatgpt镜像网站会有更加详细的解析,本章节使用到了其中的一些方法可做参考
目录
1.1:同包目录下的读取文件方式(.properties文件)
1:各个位置下的资源文件的读取方式
- 同包下获取文件信息
- 不同包下获取文件信息
- 获取安全目录下的文件信息
1.1:同包目录下的读取文件方式(.properties文件)
InputStream in = demo1.class.getResourceAsStream("config.properties");
//实例化工具类
properties p = new properties();
//使用工具类中的方法加载文件
p.load(in);
System.out.println(p.getProperty("url"));
p.load(in)是 Properties 类中的一个方法,它可以从一个输入流中加载键值对数据,并将其存储到一个 Properties 对象中。通常,输入流中保存的是一个属性文件(例如"*.properties"),其中包含了一系列的属性和值。
在上面的代码中,使用了一个 InputStream 类型的变量 in 进行了加载操作。调用 p.load(in) 方法后,会将 in 中的属性文件内容加载到 Properties 对象 p 中。接着使用 p.getProperty(“url”) 可以根据 key 获取对应的 value(即获取“url”这个键对应的值)。如果属性文件包含了多组键值对,都会被加载到 p 中,可以通过调用相应的方法获取指定 key 的值。
1.2:同包目录下的读取文件方式(.xml文件)
//获取xml文件信息
InputStream in1 = demo1.class.getResourceAsStream("students.xml");
//实例化 SAXReader 是 dom4j 提供的用于解析 XML 文件的工具类
SAXReader s= new SAXReader();
try{
//调用工具类中的read方法
Document read = s.read(in1);
//拿到xml文件的所有信息
System.out.println(read.asXML());
// Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
System.out.println(node2.getText());
//拿到Students.xml中student下的信息
List<Element> selectNodes = read.selectNodes("/students/student");
for (Element element : selectNodes) {
//注意这里一定要asxml,否则出来的应该是文件的内存地址的信息
// System.out.println(element.asXML());
//拿到students下面的那么节点
Element node = (Element) element.selectSingleNode("name");
//拿到所有的name节点信息
System.out.println(node.asXML());
//拿到name节点中的文本信息
System.out.println(node.getText());
//拿到student节点中的id信息
System.out.println(element.attributeValue("sid"));
//只拿到sid为3的的name
if("s003".equals(element.attributeValue("sid"))) {
System.out.println(element.selectSingleNode("name").getText());
}
}catch{
e.printStackTrace();
}
1.3:获取不同包的文件信息
//获取不同包下面的文件信息 主要是改路劲那里价格/就可以了
InputStream in2 = demo1.class.getResourceAsStream("/students.xml");
SAXReader ss= new SAXReader();
try {
Document read = ss.read(in2);
List<Element> node = read.selectNodes("/students");
for (Element element : node) {
System.out.println(element.asXML());
}
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
1.4:获取安全目录下的文件信息(web-inf)
在Java Web应用程序中,WEB-INF
目录是受保护的目录,可以存放配置文件和其他敏感数据,不能直接访问。可以通过 ServletContext
对象获取 WEB-INF
目录下的文件,通过使用 getResourceAsStream()
方法将文件读入 InputStream
对象中,以进行文件操作,这可以保证 WEB-INF 目录下的文件的安全性。
ServletContext
对象是 Web 应用程序的上下文,包含 Web 应用程序的全局信息。应用程序部署时,创建一个ServletContext
对象,表示整个 Web 应用程序的上下文,其中包含了该 Web 应用程序的配置信息、能够访问的资源列表等。使用ServletContext
对象可以访问 Web 应用程序中的任何资源,包括磁盘上的文件以及在 Web 应用程序内部和外部存储的数据。
此时我把文件放在安全目录下去进行访问
看代码
package Servlet;
import java.io.IOException;
import java.io.InputStream;
import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
@WebServlet("/oneSerlvet")
public class oneSerlvet extends HttpServlet {
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
doPost(request, response);
}
protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
//获取web-inf目录下的文件信息
InputStream in = getServletContext().getResourceAsStream("/WEB-INF/students.xml");
SAXReader s= new SAXReader();
try {
Document read = s.read(in);
System.out.println(read.asXML());
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
看看打印结果
这样,我们就已经拿到xml的整个文件的信息啦
2:xpath解析
2.1:什么是xpath
XPath
(XML Path Language)是一种基于XML
结构的查询语言,它使用路径表达式来描述和定位XML
文档中的元素。XPath 是由W3C
推荐的标准,被广泛应用于XML
文档的解析、查询和操作。通过
XPath
可以简化XML
文档内部节点的查找。使用XPath
可以通过指定节点路径来定位文档中的某个节点或一组节点。因此,XPath
解析可用于快速、方便地解析和处理XML
文档。XPath
也可用于快速查找和过滤非常大的XML文件中的数据。
简单来说:我们通常拿到指定节点的信息,需要通过层层的循环,然后遍历判断,才能够拿到我们想要的数据,但是如果配置信息中的层级过多,就会很麻烦,于是就出现了通过xpath去拿到元素信息的方式
举个例子,这里是我们的xml配置文件信息
现在我们通过xpath要拿到sid为s003中的name节点的文本信息
//通过xpath解析法直接拿到指定的文件信息
// Node node2 = read.selectSingleNode("/students/student[@sid='s002']/name");
// System.out.println(node2.getText());
这就是今天的全部内容啦!感谢观看