Jsoup是解析HTML的工具,使用时要导入Jsoup.jar包
获取网址的HTML文件
// 获取Jsoup连接
Connection con = Jsoup.connect("http://www.imooc.com/learn/" + classNo);
// 获取Document对象
Document doc = con.get();
获取标签中的HTML内容,例如<a><b>sdskd</b></a> 中标签的内容是<b>sdskd</b>
title = doc.getElementsByTag("h2").html();
获取标签中的文本信息,<a>dsjkeu<b>sdskd</b></a> 中标签的文本信息是sdskd
// 获取元素的文本
videoName = element.text();
对于select,在手册上没仔细看
// 这个用法还没找到,我的理解是查找标签a中含有video的标签元素
Elements videos = doc.select(".video a");
更多参看:
http://my.oschina.net/sjr/blog/126725
http://www.open-open.com/jsoup/parsing-a-document.htm