上一篇学习了DOM4J里面的常见的解析文件和如何写一个xml文件内容。其实DOM4J这个开源的工具除了支持DOM解析之外,它还支持XPath解析,XPath解析也经常使用。这一篇,我们就来学习下如何通过xpath表达式来得到xml里面的内容。我们在Selenium UI自动化学习的时候经常使用xpath来定位元素,同样在一个xml里面,其实就是一个DOM树,从根节点开始,我们也可以通过路径的方式去获取某一个元素的值,这就是xpath解析。如果你做的一个服务器的接口测试,返回的数据是xml文件类型,那么你在断言的时候,使用XPath就很简单。
1.环境准备
准备把一个xml内容放在项目根目录
<?xml version="1.0" encoding="UTF-8"?>
<students>
<student number="j2ee_0001">
<name>张三</name>
<age>18</age>
<gender>male</gender>
</student>
<student number="j2ee_0002">
<name>李四</name>
<age>19</age>
<gender>female</gender>
</student>
</students>
2.在一个包下写一个Junit的类
我这里写一个方法,去拿到第二个学生的名称是不是李四
package com.anthony.parse;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
public class ParseByXPathTest {
@Test
public void test1() throws DocumentException {
SAXReader reader = new SAXReader();
Document doc = reader.read("student.xml");
//parse by xpath to get Text
Node node = doc.selectSingleNode("/students/student[2]/name");
System.out.println(node.getText());
}
}
运行结果报错
java.lang.NoClassDefFoundError: org/jaxen/JaxenException
这个提示没定义这样的类,缺少的这个东西叫jaxen, 原来,我们项目build path下的lib光有dom4j的jar还是不行,还需要一个jaxen-xxx.jar的文件,我们去maven的网站去找一下https://mvnrepository.com/artifact/jaxen/jaxen/1.1.1
然后添加到项目的build path中去,再次运行就能输出结果。
李四
下面再举例一个如何获取某一个标签的属性值。
package com.anthony.parse;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
public class ParseByXPathTest {
@Test
public void test1() throws DocumentException {
SAXReader reader = new SAXReader();
Document doc = reader.read("student.xml");
//parse by xpath to get Text
Node node = doc.selectSingleNode("/students/student[2]/name");
System.out.println(node.getText());
}
@Test
public void test2() throws DocumentException {
SAXReader reader = new SAXReader();
Document doc = reader.read("student.xml");
//parse by xpath to get attribute value
Node node = doc.selectSingleNode("/students/student[2]");
System.out.println(node.getText());
System.out.println(node.valueOf("@number"));
}
}
上面的test2就是来获取属性number的值
j2ee_0002
从上面的例子来看,如果只是拿到某一些标签的文本或者标签内属性的值,我还是喜欢通过XPath的方式,代码简单。当然我上面还有一个方法没有介绍,那就是获取一组标签doc.selectNodes(xpath),有兴趣可以通过这个方法,获取两个student,xpath这样写/students/student 就能得到一个Node对象列表。