爬虫模拟登陆手机验证码_Python 网络爬虫之模拟登陆合集

最新推荐文章于 2024-07-14 20:36:58 发布

weixin_39770165

最新推荐文章于 2024-07-14 20:36:58 发布

阅读量846

点赞数 1

文章标签：爬虫模拟登陆手机验证码登陆界面网页代码

摘要：之前我们爬取的实习僧、糗事百科、网易新闻都是不需要登陆，不需要你去做账号、Cookies、Session等等，顶多只需要一个 headers （请求头），但还有一类是需要：你（注册）账号登陆才能进行后续的操作。

例如：淘宝、知乎、豆瓣之类的需要你登陆的。

我们之前又整合一些 requests 库提供 http 的所有基本请求方式：

Python资源共享群：315346913

回顾：

1.GET请求

可利用params参数

输出结果：

2.POST请求

利用data参数为POST添加参数：

上传文件的方式：

方法一：

方法二：

我个人更习惯或者说更 Python 的操作，是方法二：

步入正题：

个人目前知道有以下几种操作方法：

POST 请求方法：需要在后台获取登录的 URL并填写请求体参数，然后 POST 请求登录，相对麻烦；
添加 Cookies 方法：先登录然后，将获取到的 Cookies 加入 Headers 中，最后用 GET 方法请求登录，这种最为方便；（个人比较喜欢这个方法）
Selenium 模拟登录：代替手工操作，自动完成账号和密码的输入，简单但速度比较慢。

下面用代码分别实现这三种方法。

1. 目标网页

这是我们要爬取的目标网页：

URL：https://www.itjuzi.com/investevent

该网页需要先登录才能看到数据信息，登录界面如下：

可以看到，只需要输入账号和密码就可以登录，不用输验证码，比较简单。下面利用我个人的账号实现，来实现模拟登录。

POST 提交请求登录

1

首先，我们要找到 POST 请求的 URL。

有两种方法，第一种是在直接右键在开发者工具中查看（在浏览器当中按：F12 ），第二种是在 Fiddler 软件中查看。

我们在调出开发者工具的时候，如果把控制台放在地下，会出现如下测试了火狐浏览器和谷歌浏览皆为如此：

所以，需要把开发者工具放在别的方向，例如：

weixin_39770165

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。