Jsoup

最新推荐文章于 2024-05-03 17:19:41 发布

真好，好的不得了

最新推荐文章于 2024-05-03 17:19:41 发布

阅读量166

点赞数

分类专栏：爬虫文章标签： Jsoup

本文链接：https://blog.csdn.net/qq_41854797/article/details/88874686

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

简单的爬取网页信息
爬去取网页所有信息

//connect(String url) 创建并返回url连接
//Document	|	get()	|	Execute the request as a GET, and parse the result.
Jsoup.connect("url").get();

然后过滤出自己想要的数据

Elements select = document.select("div[class='d_post_content j_d_post_content']");
		for(Element e : select) {
			System.out.println(e.text());
		}

document类常用方法
在这里插入图片描述
element类常用方法

爬取方式：
1、从网页上爬取 Jsoup.connect(String url)
2、从本地文件上爬取 Jsoup.parse(String url,String character)
3、从String加载文档，使用Jsoup.parse(String html)方法从字符串加载HTML