最近做一个东西用到了html的解析,这里我就把自己最近研究的东西贴出来。
用到的是jsoup第三方的库,感觉用起来还是很好用的。
//获取课表
Document doc = Jsoup.parse(result);//传入html解析
Element element = doc.getElementById("printcontent");根据id查到元素
Elements links = element.getElementsByTag("a");//更局tag获取所有节点
然后就是对节点的遍历
for(Element e:links ){
e.text();//获取节点里面的内容
}
还有一些常用的方法就是
对表格的处理
Elements element = doc.select("table").select("tr").select("td");//对table表的筛选
links.attr("href")//提取连接
基本上配合一些正则表达式,对html页面的处理也够了。