爬虫模拟登录的思路

创建时间 2020年7月6日

通过对 COOKIES 的分析找出登录必需的 COOKIE,剔除可能会导致登录状态失效的 COOKIE(有些过期时间短的非必要 COOKIE 可能会导致模拟登录失败)。

方法并不局限于 B 站,对绝大部分网站来说都是适用的。

1. 分析必需 COOKIE

  1. 抓包登录接口获取返回的 Set-Cookie 值
  2. 在站点信息中找 COOKIE,然后去除不必要 COOKIE 然后保存必须 COOKIE

对第 2 步去除 COOKIE来说,有如下技巧:

  • 看名字
  • 看过期时间

一般来说名字奇特的 COOKIE(比如名字像乱码什么的)和过期时间超长(短)的 COOKIE 都可以先尝试在 COOKIE 管理面板删除,如果删除后出现了登录状态失效的情况,下次避开这些 COOKIE 即可(实际上这些 COOKIE 就是登录必需的 COOKIE)。

碰到名字全大写的 COOKIE 就要注意了,这些 COOKIE 可能有着重要作用,在觉得不必要的 COOKIE 都删除完毕后可以尝试删除这些 COOKIE,然后找出登录必需的 COOKIE。

找到登录必需 COOKIE 后只需要记录下这些 COOKIE 的过期时间然后在它们过期之前更新其值即可。

2. 通过爬虫模拟登录

有了第一步的 COOKIE 之后这一步就非常简单了,我们只需要在请求头的 cookie 字段内添加第一步获取的 cookie 即可。

这里对于 COOKIE 的保存个人推荐把 COOKIE 放到文本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值