Python爬虫requests模块高级操作模拟登陆五

本文介绍了如何使用Python爬虫的requests模块进行模拟登录人人网,详细解析了登录过程中post请求的参数,包括用户名、密码、验证码,并强调了验证码的动态变化特性。在成功模拟登录后,目标是爬取用户个人主页的详细信息。
摘要由CSDN通过智能技术生成

模拟登录: - 爬取基于某些用户的用户信息。

需求:对人人网进行模拟登录。
    - 点击登录按钮之后会发起一个post请求
    - post请求中会携带登录之前录入的相关的登录信息(用户名,密码,验证码......)
    - 验证码:每次请求都会变化

需求:爬取当前用户的相关的用户信息(个人主页中显示的用户信息)

分析:

---模拟浏览器请求行为

  • 在浏览器中进行登录时,录入完用户名、密码和验证码后,需要点击登录按钮。只有在点击登录按钮后,当前页面才会发起一次网络请求。该次网络请求可以通过抓包工具捕获。

  • 经过抓包分析后,我们就可以模拟浏览器点击登陆按钮后发起的请求操作了。该请求为post请求,对应的url在上图中可以看到,且请求携带的参数也可以在抓到的数据包中获取。

参数分析:
email:用户名
password:密码
icode:验证码(通过云打码识别)
剩下的参数不需要分析

#编码流程:
#1.验证码的识别,获取验证码图片的文字数据
#2.对post请求进行发送(处理请求参数)
#3.对响应数据进行持久化存储

from CodeClass import YDMHttp #云打码提供的类(先
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值