beautifulsoup爬取网页中的表格_Python抓取并存储网页数据原来这么简单?以前居然不知道...

爬虫是Python必学的一个模块,使用Python爬虫我们可以很轻松的从网络中爬取我们想要的数据。如果你还是入门爬虫阶段或者不清楚爬虫的具体操作流程,我在下文教大家一些方法:

第一步:尝试请求

首先进入b站首页,点击排行榜并复制链接

https://www.bilibili.com/ranking?spm_id_from=333.851.b_7072696d61727950616765546162.3

现在启动Jupyter notebook,并运行以下代码

6d9a9106fe73e333c8f6d3a7ae4eec3c.png

在上面的代码中,我们完成了下面三件事

  • 导入requests
  • 使用get方法构造请求
  • 使用status_code获取网页状态码

可以看到返回值是200,表示服务器正常响应,这意味着我们可以继续进行。

第二步:解析页面

在上一步我们通过requests向网站请求数据后,成功得到一个包含服务器资源的Response对象,现在我们可以使用.text来查看其内容

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值