Java使用Jsoup爬虫获取网站内容(二)Jsoup介绍

5 篇文章 0 订阅
5 篇文章 0 订阅

Jsoup

Jsoup是可以对获取到的html页面和URL地址进行解析,并且可以通过DOM,CSS的方式以及类似于jQuery的方式来操作数据的Java的html解析器。
Jsoup也可以用于操作HTML的元素 和 属性。

方法介绍

Jsoup可以通过设置URL和超时时间的方式对指定地址进行解析,并获得一个Document对象。也可以通过文件的形式和编码方式对文档文件进行解析
1.通过地址和超时时间进行解析

public static Document parse(URL url, int timeoutMillis) throws IOException {
        Connection con = HttpConnection.connect(url);
        con.timeout(timeoutMillis);
        return con.get();
    }

2.通过文件和编码格式进行解析

 public static Document parse(File in, String charsetName) throws IOException {
        return DataUtil.load(in, charsetName, in.getAbsolutePath());
    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值