一、selector 选择器
使用的方法:Elements select(String cssQuery)
语法:参考 Selector 类中定义的语法
public class JsoupDemo {
public static void main(String[] args) throws Exception{
String path = JsoupDemo.class.getClassLoader().getResource("student.xml").getPath();
//解析xml文档,加载文档进内存,获取dom树--->Document
Document document = Jsoup.parse(new File(path),"utf-8");
// 查询 name 标签
Elements elements = document.select("name");
// 查询 id 值为 1 的元素
Elements elements1 = document.select("#1");
// 获取 student 标签并且 id 属性为 1 的 age 子标签
Elements elements2 = document.select("student[id=\"1\"]");
Elements elements3 = document.select("student[id=\"1\"]>age");
System.out.println(elements3);
}
}
二、XPath
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言
* 使用Jsoup的Xpath需要额外导入jar包。
* 查询w3cshool参考手册,使用xpath的语法完成查询
//1.获取student.xml的path
String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
//2.获取Document对象
Document document = Jsoup.parse(new File(path), "utf-8");
//3.根据document对象,创建JXDocument对象
JXDocument jxDocument = new JXDocument(document);
//4.结合xpath语法查询
//4.1查询所有student标签
List<JXNode> jxNodes = jxDocument.selN("//student");
for (JXNode jxNode : jxNodes) {
System.out.println(jxNode);
}
//4.2查询所有student标签下的name标签
List<JXNode> jxNodes2 = jxDocument.selN("//student/name");
for (JXNode jxNode : jxNodes2) {
System.out.println(jxNode);
}
//4.3查询student标签下带有id属性的name标签
List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");
for (JXNode jxNode : jxNodes3) {
System.out.println(jxNode);
}
//4.4查询student标签下带有id属性的name标签 并且id属性值为1
List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='1']");
for (JXNode jxNode : jxNodes4) {
System.out.println(jxNode);
}
三、测试用的 student.xml 文件
<?xml version='1.0' encoding="UTF-8"?>
<students>
<student>
<name id='1'>zhang san</name>
<age>23</age>
<gender>male</gender>
<br/>
</student>
<student>
<name id='2'>lisi</name>
<age>24</age>
<gender>female</gender>
<br/>
</student>
</students>