简单的爬取网页信息
爬去取网页所有信息
//connect(String url) 创建并返回url连接
//Document | get() | Execute the request as a GET, and parse the result.
Jsoup.connect("url").get();
然后过滤出自己想要的数据
Elements select = document.select("div[class='d_post_content j_d_post_content']");
for(Element e : select) {
System.out.println(e.text());
}
document类常用方法
element类常用方法
爬取方式:
1、从网页上爬取 Jsoup.connect(String url)
2、从本地文件上爬取 Jsoup.parse(String url,String character)
3、从String加载文档,使用Jsoup.parse(String html)方法从字符串加载HTML