Jsoup

简单的爬取网页信息
爬去取网页所有信息

//connect(String url) 创建并返回url连接
//Document	|	get​()	|	Execute the request as a GET, and parse the result.
Jsoup.connect("url").get();

然后过滤出自己想要的数据

Elements select = document.select("div[class='d_post_content j_d_post_content']");
		for(Element e : select) {
			System.out.println(e.text());
		}

document类常用方法
在这里插入图片描述
element类常用方法
在这里插入图片描述
爬取方式:
1、从网页上爬取 Jsoup.connect(String url)
2、从本地文件上爬取 Jsoup.parse(String url,String character)
3、从String加载文档,使用Jsoup.parse(String html)方法从字符串加载HTML

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值