python爬虫(二):向网页提交数据

本文介绍了Python爬虫如何处理异步加载的数据,解释了异步加载的概念,并通过实例展示了使用requests库的post方法提交表单、获取返回信息的步骤。文章还分析了网页网络请求,提取关键参数,以实现翻页获取数据。
摘要由CSDN通过智能技术生成

python爬虫(二):向网页提交数据

回忆一下,我们有的时候在看一些网站的时候,是否遇见过一些网站里面的信息开始显示一部分,然后当我们把鼠标滑轮向下拉动后,又显示出一些信息。这就是异步加载。我的上一篇文章python爬虫百度贴吧标题数据爬取的所有标题都是页面已经加载好的。但是对于这种开始没有加载好的数据我们应该如何爬取呢?

接下来我们先介绍下一些概念:

  • 异步加载:举个简单的例子就是说,假如老师判作业,有两种情况,第一种就是无论哪个学生先写完,都等待到所有的同学全部写完,老师讲所有的作业都收齐后开始判作业。第二种情况就是有一个同学写完作业,老师就判一个。这样可以节省一些时间,也不会影响进度。这里的第二种方法就是异步加载。
  • Get方法是从服务器上获取数据
  • Post是向服务器传送数据
  • Get通过构造URL中的参数来实现功能
  • Post是将数据放在header中提交数据

向网页提交数据

  • 核心方法:requests.post
  • 核心步骤:构造表单-提交表单-获取返回信息

进入我们构建代码环节

首先 我们先来浏览下我们要爬取的网站:

这里写图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值