#coding:utf-8 #__author__='wang' import time,json,base64 ''' requests登陆知乎流程: requests登录知乎流程: 1>想到去抓包,查看用户名,密码表单数据的提交地址,也就是POST请求将表单数据提交的地址。 经过查看是:https://www.zhihu.com/api/v3/oauth/sign_in。 2>通过抓取上述登录地址,在其请求的Content字段中,发现POST到服务器的地址不只包含用户名 ,密码,还有timestamp, lang, client_id, signature等表单数据。所以,需要知道每 一个表单数据的特点,而特点我们从数据在每次登录时是否变化来查找数据的规律。 3>经过多次登录的观察,这些表单数据中,只有timestamp,signature是变化的,其它的值 都是不变的。 4>通过JS发现signature字段的值,是由多个字段组合加密而成,其实timestamp时间戳是核心 ,每次根据时间戳的变化,生成不同的signature值。 5>考虑到signature的加密过程较为复杂,所以直接将浏览器登录成功后的时间戳timestamp 和签名signature复制到请求数据中,然后进行登录。 6>表单数据填充完毕,发送POST请求时,出现了"缺少验证码票据的错误(capsion_ticket)", 经过分析,验证码票据是为获取验证码而提供的一种验证方式,而抓包工具中关于验证码的请求有 两次。一次获取的是:{'show_captcha': true},而同时请求的第二次获取的是: {'img_base64': 'Rfadausifupoauerfae'}。 7>经过分析,{'show_captcha': true}是获取验证码的关键信息,在抓包信息中,发现第一次 请求的响应中的Set-Cookie中,包含了capsion_ticket验证码票据信息。 8>再次模拟登录,又出现了"ERR_XX_AUTH_TOKEN"错误信息,而它出现在我们根据验证码票据获 取验证码图片时。我们从抓包信息中,查看关于captcha?lang=cn的请求信息,发现在请求头中 有这样一个字段:Authorization: oauth ce30dasjfldhjfadsfasdfad。所以将其在 headers中进行配置。 ''' import requests try: import cookielib except Exception,e: import http.cookiejar
requests登录知乎新版
最新推荐文章于 2023-08-28 16:41:23 发布