Jsoup 抓取网页信息(2) 需要Login的网页信息抓取

本文介绍了如何使用Jsoup抓取需要登录后才能查看的网页内容。通过设置cookies模拟登录,详细步骤包括登录账号、获取Chrome浏览器中的cookies,并利用Jsoup加载cookies以访问登录后的网页数据。
摘要由CSDN通过智能技术生成

      有时候抓取网页信息的时候,有些网页需要先登录才能查看到真正的内容。这样用我们上一篇文章的方法是无法直接抓取数据的。

Jsoup 抓取网页信息(1) 抓取 国际疾病码

例如抓取网页:http://www.findacode.com/code-set.php?set=CPT 上的 CPT codes

登录前,显示如下:


登录后显示:


我们要抓取的信息是登录后显示的内容。

解决这个问题的方法很简单。Jsoup给我们提供了cookies的功能,我们只要将我们自己账号登录的cookies传递给Jsoup就可以实现登录用户的访问。

1。 首先,登录自己的账号。

2。然后,在chrome中 Chrome -> setting->Con

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值