jsoup的测试小样例:
public static void JsoupTest(String html){
org.jsoup.nodes.Document doc = Jsoup.parse(html);
Elements pos = doc.select("span.pos");//抽取节点<span class=pos
Elements def = doc.select("span.def");//抽取节点<span class=def
//输出抽取的节点的内容
for (int i =0;i<pos.size();i++) {
System.out.println( pos.get(i).text().trim());
System.out.println(def.get(i).text().trim());
}
Elements antElem = doc.select("div#antoid div.df_div2");//抽取<div id=antoid 下的<divclass=df_div2
Elements synElem = doc.select("div#synoid div.df_div2");//抽取<div id=synoid 下的<div class=df_div2
System.out.println(antElem.text());
System.out.println(synElem.text());
}
JSOUP通配符的使用
Elements.select("ElementName[Attribute^=Value]");//AttributeName属性以code开始的所有ElementName标签
Elements.select("ElementName[Attribute$=Value]");//AttributeName属性以code结束的所有ElementName标签
Elements.select("ElementName[Attribute*=Value]");//AttributeName属性包含code的所有ElementName标签
例如要查找所有id以jaychang开头的div元素
Elements.select("div[id^=cat]");