1、运用Jsoup删除HTML中指定元素的标签
删除指定的DIV或其他标签元素的class或id,当删除属性class与id时所运用的方法相同,他们的区别在于class运用的是 “.” 而id运用的是“#”这里跟jQuery里面获取控制HTML标签的方法类似相同。这里运用删除DIV中的id为tlink_m和p中class为search为例。具体代码如下:
Document doc = Jsoup.connect(url).data("jquery","java").userAgent("Mozilla").cookie("auth", "tiken").timeout(5000).get();
doc.select("div#tlink_m").remove();
doc.select("p.search").remove();
2 、使用选择器语法来查找标签元素
说明:由于jsoup与jquery有类似的语法,可以运用其类似jquery的语法进行查找和操作标签元素
具体方法:Element.select(String selector) 或 Elements.select(String select)
由于select方法在Document和Element以及Elements对象中多可以使用,并且它返回的是一个Elements集合
对于Selector选择器的说明: