python模拟登陆知乎（最新版)

最新推荐文章于 2024-07-17 20:12:36 发布

诡途

最新推荐文章于 2024-07-17 20:12:36 发布

阅读量651

点赞数 3

分类专栏： Python 文章标签： python 知乎爬虫抓包分析

原文链接：https://zhuanlan.zhihu.com/p/32898234

版权

Python 专栏收录该内容

82 篇文章 18 订阅

订阅专栏

引言

为啥要写这一篇文章呢？
（主要是qq群内有人在模拟登陆知乎，一直不成功）然后我抓包看了下，发现知乎登陆页已经改版了，而且难度大大提高了。

开始抓包

首先内，还是打开知乎首页，然后输入账号密码，登陆（记得输错密码）

这样我们就可以看到请求头了（请求头如下）
在这里插入图片描述

我们发现有这几个请求头和正常的不一样（红色框中的）

authorization （感觉应该是js生成的，后面再看
Content-Type （后面多了boundary=xxx 这种,那这种是啥意思呢,后面和请求参数一起看
cookie：这个要注意,登陆前cookie就不为空，说明之前肯定有set-cookie的操作
x-udid,x-sxrftoken 这两个都是验证参数,估计都在网页源代码能找到
再看一下请求参数

可以看到参数是以payload的形式出现的

第一次看到这种的人估计会一脸懵逼

这个要结合请求中的

Content-Type:

multipart/form-data; boundary=----WebKitFormBoundary2KNsyxgtG28t93VF

来一起看

multipart/form-data 是一种表单提交的方式，后面的boundary=xxx 是表单分割的方式，那到底啥意思呢？看一个简单的小列子你就能明白啦
在这里插入图片描述

------WebKitFormBoundary2KNsyxgtG28t93VF 是分割不同参数的，所以可以直接不看他（这个是由上面的Content-Type后面的boundary决定的，可以随便修改）

那把分割线去掉后，上面的就相当于 client_id=c3cef7c66a1843f8b3a9e6a1e3160e20,

grant_type=password.

那么这个payload就很好理解了.

我们来看一下，一共有哪些参数

在这里插入图片描述

参数还挺多的，可以看到很多参数都是固定的，如账号，密码，时间戳，等等

变动的有两个 client_id,signature

开始找参数

authorization ：

我们在chrome内，直接按ctrl+shift+f(全局搜索，搜索js,css这些)，可以看到已经搜索到了，并且是直接写在js里面的，然后重新随便换个账号再抓一次包，发现authorization 的值还是固定的，所以说明authorization 是直接写在js里面的，不是动态修改的(那么authorization 的值我们就已经找到了）

在这里插入图片描述

cookie：

在登陆之前，就发现cookie的值不为空，说明肯定打开网页后就有set-cookie的操作了，我们想验证的话，先打开一个无痕浏览器（主要是为了把之前的cookie全部清空，避免干扰），然后打开http://zhihu.com，我们发现他有几次set-cookie的动作

在这里插入图片描述

那我们想要模拟的话，很简单的方法是直接使用requests.session

x-udid,x-sxrftoken:
一般这种验证参数都会在网页源代码里面,所以直接查看网页源代码
可以看到已经找到了,后续就是如何把这个找出来而已，可以使用正则，或者xpath定位到
在这里插入图片描述

client_id:

你会发现client_id与上面的authorization 一模一样

signature:

还是使用ctrl+shift+f 全局搜索

发现找到了，但是参数是js动态生成的…

主要是找到如何加密的，然后使用Python模拟出来
在这里插入图片描述

第一步：下载这个js，格式化（让代码好看一些）

第二步：使用fiddle替换掉原来的js，使用刚刚格式化的js

第三步：慢慢调试。。。直到找到如何生成的…

大概步骤是这样

但是假如你js像我一样很渣的话，你可以直接找到这段加密的js，然后Python执行这段js就可以了。。。

上面呢，我们把该找的参数都找到了，接着只要模拟发送就可以了

知乎转载地址：python模拟登陆知乎（最新版)

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python模拟登陆知乎（最新版)

知乎的抓包分析
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。