1. 生成jsoup 文档对象Document
通过字符串生成
String html=="...";
Document doc=Jsoup.parse(html);
通过文件生成
String path="..";
Document doc=Jsoup.parse(new File(Path),"gb2312");
2. 获取元素
Elements elemnts= doc.getElementsByTag();
//other ways as well
此时获得的是一个数组形式的元素集合
3.获取元素下的内容
获得标签下纯文本信息
content=elements.text();
获得带标签的文本信息
content_tag=elements.toString();