requests登录知乎新版

#coding:utf-8
#__author__='wang'

import time,json,base64

'''
requests登陆知乎流程:
requests登录知乎流程:
1>想到去抓包,查看用户名,密码表单数据的提交地址,也就是POST请求将表单数据提交的地址。
经过查看是:https://www.zhihu.com/api/v3/oauth/sign_in。
2>通过抓取上述登录地址,在其请求的Content字段中,发现POST到服务器的地址不只包含用户名
,密码,还有timestamp, lang, client_id, signature等表单数据。所以,需要知道每
一个表单数据的特点,而特点我们从数据在每次登录时是否变化来查找数据的规律。
3>经过多次登录的观察,这些表单数据中,只有timestamp,signature是变化的,其它的值
都是不变的。
4>通过JS发现signature字段的值,是由多个字段组合加密而成,其实timestamp时间戳是核心
,每次根据时间戳的变化,生成不同的signature值。
5>考虑到signature的加密过程较为复杂,所以直接将浏览器登录成功后的时间戳timestamp
和签名signature复制到请求数据中,然后进行登录。
6>表单数据填充完毕,发送POST请求时,出现了"缺少验证码票据的错误(capsion_ticket)",
经过分析,验证码票据是为获取验证码而提供的一种验证方式,而抓包工具中关于验证码的请求有
两次。一次获取的是:{'show_captcha': true},而同时请求的第二次获取的是:
{'img_base64': 'Rfadausifupoauerfae'}。
7>经过分析,{'show_captcha': true}是获取验证码的关键信息,在抓包信息中,发现第一次
请求的响应中的Set-Cookie中,包含了capsion_ticket验证码票据信息。
8>再次模拟登录,又出现了"ERR_XX_AUTH_TOKEN"错误信息,而它出现在我们根据验证码票据获
取验证码图片时。我们从抓包信息中,查看关于captcha?lang=cn的请求信息,发现在请求头中
有这样一个字段:Authorization: oauth ce30dasjfldhjfadsfasdfad。所以将其在
headers中进行配置。

'''

import requests
try:
    import cookielib
except Exception,e:
    import http.cookiejar 
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值