如果 html 标签的class 只要一个,可以通过
Document doc = Jsoup
.connect(("http://www.xxxxxx.com))
.timeout(limitTime).get();
doc.getElementsByClass("xxx") 获取。
但是有些标签声明的 class 有多个, 多个class 之间是通过 空格 进行分开声明 如 <div class="item clearfix"> 就有两个 ,获取办法如下:
<div class="item clearfix">
jsoup中选择器中某一个元素的多个条件之间不要加空格,加了空格下一个条件就变成子元素的条件了
Elements links = doc.select("div.item.clearfix");
也可以 Elements links = doc.select("div.item");
这个时候获取到的是 item 标签下的内容