前言
==
大家好,我叫善念,此篇文章为盲写,何为盲写呢…就是我也没做任何准备,自己也没有做过这个实战,但是我心里肯定已经是有思路了的。
其实这样子的话对读者未必就一定是坏的,因为我没做过的话,那么在写文章的时候分析过程肯定是特别清晰的。而咱们学习的是案例吗?不是,记住你学习的一定是分析的方法。
分析(x0 整体思路分析)
=============
想一下思路吧,当我们进入一些好友的空间的时候你会发现有些是可以直接进入的,而有些却是这样的:(翻了几十个好友可算找到个不让我访问的了…)
那么也就是说我只需要获取到所有的好友号码,然后get请求看返回的文本中是否有主人设置了权限,您可通过以下方式访问这些关键字就可以了。
可以看到这个get的请求有点长,后面一串咱们都看不懂是什么,那么我们删除它们看看能否正常访问:
结果显示是一样的,其实这个就是叫做参数冗余,比如咱们搜一个百度
可以看到除了咱们得关键字123外,还有很多其他的参数,那么如果我们删除这些参数呢?
结果显示一致,这就叫参数冗余(多余),那么剩下的就是看咱们如何获取到自己的所有好友啦!
分析(x1 好友数据的获取)
==============
关于好友的接口数据有很多阿…群官网,空间官网都是可以获取的,由于我写过一篇Python采集群人员数据,记录JavaScript逆向分析过程 文章中写过如何获取群数据,其实这个接口同样可以获取到好友数据,所以的话我下面就用群官网的接口啦!
准备工作
使用到的模块
from selenium import webdriver
import json
import requests
import execjs
import jsonpath
模块的安装
主要利用到这五个模块,其中json为内置模块,其它均为第三方模块。安装方式如下所示:
pip install selenium
pip install requests
pip install PyExecjs
pip install jsonpath
插件的安装
关于selenium这个模块,咱们来重点介绍一下:
Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。
如果不能够理解我就讲点白话,如果你是web开发人员,开发好了几百个网站,那么如果你认为的去一个个的测试BUG,是不是很浪费时间?而selenium这个框架就是用来模拟人去自动化操控浏览器的,那么是不是就节约了很多时间呢。
既然selenium能够操控浏览器,那么它们之间必须要有一个桥梁,总不能无中生有吧?
那么操控的浏览器款式不一样,中间的桥梁也是不一样的。比如我更喜欢用chrome浏览器,那么咱们需要下载一个selenium与Chrome的桥梁——Chromedriver插件
下载与你当前谷歌浏览器版本最相近的Chromedriver
那么像我的话,下载 即可。
Windows系统需下载32位,其它的自己看着办。点进去下载win32即可。
那么如何让Python与selenium连接起来呢,这里咱们需要配置一个环境变量,就是把Python与selenium处于同一个目录:
到此为止,咱们的环境就搭建好了。
分析(x0)
进入咱们的目标网站:目标网站
点击登录后点击群管理:
再点击成员管理,进入咱们的数据页面:
在这里大家就很好奇了,为什么我要获取好友数据,跑到群数据里来呢?
在这个时候,咱们打开浏览器的开发者工具,点击成员管理
你会发现你抓到两个特别的包,一个是获取群数据列表,一个是获取好友列表,在这里我就不看群数据了,想看的自己去看我前面写过的文章即可。
post请求,参数为bkn为变化的值,返回的数据为:
可以看到返回的result中有四个分组,其实就是我好友的四个分组…里面的数据如何提取出来呢?那是不是咱们先需要把前面的bkn参数搞定呀!当然你可以把bkn写死,把cookies也写死,一样可以post得到数据,但是每次都要去抓包复制显得你很low。
分析(x2)
走吧,开始去分析咱们的bkn是如何生成的:
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
862fe4e9.png)
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
