python爬虫(二):向网页提交数据
回忆一下,我们有的时候在看一些网站的时候,是否遇见过一些网站里面的信息开始显示一部分,然后当我们把鼠标滑轮向下拉动后,又显示出一些信息。这就是异步加载。我的上一篇文章python爬虫百度贴吧标题数据爬取的所有标题都是页面已经加载好的。但是对于这种开始没有加载好的数据我们应该如何爬取呢?
接下来我们先介绍下一些概念:
- 异步加载:举个简单的例子就是说,假如老师判作业,有两种情况,第一种就是无论哪个学生先写完,都等待到所有的同学全部写完,老师讲所有的作业都收齐后开始判作业。第二种情况就是有一个同学写完作业,老师就判一个。这样可以节省一些时间,也不会影响进度。这里的第二种方法就是异步加载。
- Get方法是从服务器上获取数据
- Post是向服务器传送数据
- Get通过构造URL中的参数来实现功能
- Post是将数据放在header中提交数据
向网页提交数据
- 核心方法:requests.post
- 核心步骤:构造表单-提交表单-获取返回信息