使用Jsoup进行元素的查找有两种方法。有使用DOM方法来遍历一个文档,也有使用选择器语法来查找元素,而后者类似于CSS或jQuery的语法来查找和操作元素。对于这两个方法到底使用哪个感觉好上手我觉得因人而异,在我尝试了两种方法之后我还是选择select,所以我就只总结select的语法使用了,对于DOM方法感兴趣的,可以看一下这一篇博客:【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档,看之前最好先了解一下Java网络爬虫–HTML DOM(HTML 基础)。
select详解
Document 继承自 Element 类。select方法将返回一个Elements集合。
1.通过标签名来查找:
测试代码:
<span>33</span>
<span>25</span>
1
2
select写法:
Elements elements = document.select("span");
1
下面的例子都按照上面的格式来写,就不进行重复的标注了。
2.通过id来查找:
<span id=\"mySpan\">36</span>
<span>20</span>
1
2
Elements elements = document.select("#mySpan");
//通过id来查找,使用方法跟css指定元素一样,用#
1
2
3.通过class名来查找:
<span class="myClass">36