爬虫模拟登陆手机验证码_Python 网络爬虫之模拟登陆合集

摘要: 之前我们爬取的实习僧、糗事百科、网易新闻都是不需要登陆,不需要你去做账号、Cookies、Session等等,顶多只需要一个 headers (请求头),但还有一类是需要:你(注册)账号登陆才能进行后续的操作。

例如:淘宝、知乎、豆瓣之类的需要你登陆的。

我们之前又整合一些 requests 库 提供 http 的所有基本请求方式:

2f0a1d1a1dd9170677e2dae836ee0d5b.png

Python资源共享群:315346913

回顾:

1.GET请求

可利用params参数

c322b7ce9e54a42d1b5ea68266ab8175.png

输出结果:

29546fc48fa6e32bfd2dd35262002b78.png

2.POST请求

利用data参数 为POST添加参数:

a15288520fd974c29287d0042c3bfff8.png

c748df0822da08afbc4d86f971a2c80d.gif

上传文件的方式:

方法一:

f057d61782f03ed1aef3bfb539aade7b.png

方法二:

我个人更习惯或者说更 Python 的操作,是方法二:

a414b7ad68619d94e25075cbd005cafd.png

c748df0822da08afbc4d86f971a2c80d.gif

步入正题:

个人目前知道有以下几种操作方法:

  1. POST 请求方法:需要在后台获取登录的 URL并填写请求体参数,然后 POST 请求登录,相对麻烦;
  2. 添加 Cookies 方法:先登录然后,将获取到的 Cookies 加入 Headers 中,最后用 GET 方法请求登录,这种最为方便;(个人比较喜欢这个方法)
  3. Selenium 模拟登录:代替手工操作,自动完成账号和密码的输入,简单但速度比较慢。

下面用代码分别实现这三种方法。

c748df0822da08afbc4d86f971a2c80d.gif

1. 目标网页

这是我们要爬取的目标网页:

URL:https://www.itjuzi.com/investevent

562d66ee80bd69354bb71cdf385e347a.png

该网页需要先登录才能看到数据信息,登录界面如下:

3f52772d6be9fc4f630138fa0b615ac0.png

可以看到,只需要输入账号和密码就可以登录,不用输验证码,比较简单。下面利用我个人的账号实现,来实现模拟登录。

POST 提交请求登录

1

首先,我们要找到 POST 请求的 URL。

有两种方法,第一种是在直接右键在开发者工具中查看(在浏览器当中按 :F12 ),第二种是在 Fiddler 软件中查看。

我们在调出开发者工具的时候,如果把控制台放在地下,会出现如下测试了火狐浏览器和谷歌浏览皆为如此:

587d3d7fd75d49691f2000ba530209fe.png

所以,需要把开发者工具放在别的方向,例如:

22e58264c522d1ed92b2bec9170f4c59.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值