requests登录知乎新版

最新推荐文章于 2024-05-28 21:01:01 发布

y15518325965

最新推荐文章于 2024-05-28 21:01:01 发布

阅读量4.5k

点赞数

本文链接：https://blog.csdn.net/y15518325965/article/details/79406247

版权

#coding:utf-8
#__author__='wang'

import time,json,base64

'''
requests登陆知乎流程：
requests登录知乎流程：
1>想到去抓包，查看用户名，密码表单数据的提交地址，也就是POST请求将表单数据提交的地址。
经过查看是：https://www.zhihu.com/api/v3/oauth/sign_in。
2>通过抓取上述登录地址，在其请求的Content字段中，发现POST到服务器的地址不只包含用户名
，密码，还有timestamp, lang, client_id, signature等表单数据。所以，需要知道每
一个表单数据的特点，而特点我们从数据在每次登录时是否变化来查找数据的规律。
3>经过多次登录的观察，这些表单数据中，只有timestamp，signature是变化的，其它的值
都是不变的。
4>通过JS发现signature字段的值，是由多个字段组合加密而成，其实timestamp时间戳是核心
，每次根据时间戳的变化，生成不同的signature值。
5>考虑到signature的加密过程较为复杂，所以直接将浏览器登录成功后的时间戳timestamp
和签名signature复制到请求数据中，然后进行登录。
6>表单数据填充完毕，发送POST请求时，出现了"缺少验证码票据的错误(capsion_ticket)"，
经过分析，验证码票据是为获取验证码而提供的一种验证方式，而抓包工具中关于验证码的请求有
两次。一次获取的是：{'show_captcha': true}，而同时请求的第二次获取的是：
{'img_base64': 'Rfadausifupoauerfae'}。
7>经过分析，{'show_captcha': true}是获取验证码的关键信息，在抓包信息中，发现第一次
请求的响应中的Set-Cookie中，包含了capsion_ticket验证码票据信息。
8>再次模拟登录，又出现了"ERR_XX_AUTH_TOKEN"错误信息，而它出现在我们根据验证码票据获
取验证码图片时。我们从抓包信息中，查看关于captcha?lang=cn的请求信息，发现在请求头中
有这样一个字段：Authorization: oauth ce30dasjfldhjfadsfasdfad。所以将其在
headers中进行配置。

'''

import requests
try:
    import cookielib
except Exception,e:
    import http.cookiejar

最低0.47元/天解锁文章

y15518325965

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
requests登录知乎新版

#coding:utf-8#__author__='wang'import time,json,base64'''requests登陆知乎流程：requests登录知乎流程：1&gt;想到去抓包，查看用户名，密码表单数据的提交地址，也就是POST请求将表单数据提交的地址。经过查看是：https://www.zhihu.com/api/v3/oauth/sign_in。2&gt;...
复制链接

扫一扫