使用XPath定位XML信息

我在解析XML的两种方式一文中,详细介绍了遍历XML文档的方法。但是,如果我们只关注某一元素或者某一属性,遍历的方式则显得过于繁琐,此时我们可以使用XPath来定位信息。
以如下内容的XML文档为例:

<?xml version="1.0" encoding="UTF-8"?>
<Employees>
  <Person>
   <name>zhangsan</name>
   <salary unit="RMB">1000</salary>
   <hireDate>2020-4-5</hireDate>
  </Person>
  <Person>
   <name>lisi</name>
   <salary unit="dollors">1500</salary>
   <hireDate>2020-5-5</hireDate>
  </Person>
  <Person>
   <name>wangwu</name>
   <salary unit="RMB">800</salary>
   <hireDate>2020-4-15</hireDate>
  </Person>  
</Employees>

路径:

/Employees/Person/name

表示XML文档中的所有name元素。

而路径:

/Employees/Person[1]/name[1]

对应于XML文档中元素内容为张三的元素

路径

/Employees/Person/salary/@unit

表示XML中所有元素 salary的属性dollors.

了解清楚了,路径对应的定位信息,接下来,来介绍获取定位信息的内容,步骤如下:

  1. 创建工厂对象
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse("./employees.xml");
XPathFactory xpfactory=XPathFactory.newInstance();
  1. 获取XPath对象
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse("./employees.xml");
XPathFactory xpfactory=XPathFactory.newInstance();
XPath xpath=xpfactory.newXPath();
  1. 解析定位信息的内容
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse("./employees.xml");
XPathFactory xpfactory=XPathFactory.newInstance();
XPath xpath=xpfactory.newXPath();
NodeList list=(NodeList)path.evaluate("/Employees/Person/name",doc,XPathConstants.NODESET);//遍历name元素
  for(int i=0;i<list.getLength();i++)
  {
   Node node=list.item(i);
   System.out.println(((Text)node.getFirstChild()).getData());
  }
  String name=(String)path.evaluate("/Employees/Person[1]/name[1]",doc,XPathConstants.STRING);//获取第一个Person下的第一个name元素的内容
  System.out.println(name);
  NodeList attrlist=(NodeList)path.evaluate("/Employees/Person/salary/@unit",doc,XPathConstants.NODESET);//获取salary属性unit的集合
  for(int i=0;i<attrlist.getLength();i++)
  {
   Node node=attrlist.item(i);
   System.out.println(node.getNodeValue());
  }

参数XPathConstants用于代表evaluate方法返回值类型,详细信息查看JDK文档

完整的代码如下:

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.*;
import java.io.File;
import org.xml.sax.SAXException;
import java.io.IOException;
import javax.xml.xpath.XPathFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpressionException;
public class xmlTest
{
 public static void main(String[] args) throws ParserConfigurationException,SAXException,IOException,XPathExpressionException
 {
  DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
  DocumentBuilder builder=factory.newDocumentBuilder();
  Document doc=builder.parse(new File("./employees.xml"));
  XPathFactory xpfactory=XPathFactory.newInstance();
  XPath path=xpfactory.newXPath();
  NodeList list=(NodeList)path.evaluate("/Employees/Person/name",doc,XPathConstants.NODESET);//遍历name元素
  for(int i=0;i<list.getLength();i++)
  {
   Node node=list.item(i);
   System.out.println(((Text)node.getFirstChild()).getData());
  }
  String name=(String)path.evaluate("/Employees/Person[2]/salary[1]/@unit",doc,XPathConstants.STRING);//获取第一个Person下的第一个salary元素属性unit的内容
  System.out.println(name);
  NodeList attrlist=(NodeList)path.evaluate("/Employees/Person/salary/@unit",doc,XPathConstants.NODESET);//获取salary属性unit的集合
  for(int i=0;i<attrlist.getLength();i++)
  {
   Node node=attrlist.item(i);
   System.out.println(node.getNodeValue());
  }
 }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值