获取http://futures.hexun.com/industrynews的html页面数据为例。
首先需要导入Jsoup的jar包
1、创建Document(org.jsoup.nodes包下的)
Document doc = (Document) Jsoup.parse(html);
这里的html为获取后返回的数据
2、根据需求找到自己需要的元素
Elements element = (Elements) doc.getElementsByClass("temp01");
这里找到的是class为temp01的标签元素
3、解析temp01标签下的数据,实际根据数据格式。
Elements links = title.select("li");
找到temp01下所有的<li>标签。
4、解析li标签下的数据,遍历li
//遍历<li>
for(Element link : links)
{
String text = link.text(); //获取每一个Li下面所有的文本的值(有一个获取一个,两个则获取两个,连起来的)
//获取超链接的值
String url = link.attr("href");
}
其他的详见Jsoup使用选择器语法来查找元素
API http://jsoup.org/apidocs/org/jsoup/select/Selector.html