辣条开源篇:《Python进阶必备之JS逆向-某榜某博数据采集》
对应视频教程:《→→→Python进阶必备之JS逆向←←←》
希望大家多多支持辣条,感激不尽,对应教程的课件+源码也都在文末我的个人名片拿即可,看到视频教程还有文案希望多多三连支持,个辣条顶起来啊~
ps:本文仅供参考学习,辣条希望大家加油冲冲冲 @TOC
工具准备
开发工具:pycharm
开发环境:python3.7, Windows10
使用工具包:requests,execjs,md5
采集目标地址
项目需求分析
今日需求获取某榜上面的博主信息,首先区分我们的数据是静态数据还是动态数据,在浏览器页面鼠标右击点击查看网页源代码,进行搜索你想要的数据,能搜索到就是静态,搜索不到就行动态数据,很明显我们的数据是动态数据
动态数据我们需要通过抓包的方式进行获取,鼠标右击点击检查,点击网络点击xhr,就是我们所说的动态数据,刷新我们的页面,找到我们想要的数据信息
明确我们的数据之后,点击标头,第一栏就是我们的请求网址,拿到我们url地址,发送网络请求,请求方法是post说明我们需要携带参数发送请求
data = {
'end': '2022-07-23',
'rank_name': '个人认证',
'rank_name_group': '',
'start': '2022-07-23',
# 加密的数据
'nonce': '8679b4d79',
'xyz': '6262bb37e2060b2443b9b508d8760552'
}
url = 'https://www.newrank.cn/xdnphb/main/v1/weibo_day/rank'
# 发送请求 浏览器 代码
response = requests.post(url, data=data)
print(response.text)
可以很明显看到我们的数据nonce和xyz是一个加密的数据,需要对着两个参数进行逆向,首先在全局进行搜索我们加密的文件
在不确定文件的时候,可以一个个点击进行搜索,我们当前的文件是第一个双击打开文件,点击左下角大括号进行美化,在当前文件搜索对应关键字,定位到准确的js代码位置,
nonce是有j函数生成的,xyz是d函数进行加密生成的 ,先解决nonce,去查看j函数,看看他是做了什么操作,打上断点进行调试
可以看出来是生成一个9位数的随机字符,我们直接拿到当前的代码段补js环境
function j() {
for (var a = ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "a", "b", "c", "d", "e", "f"], b = 0; b < 500; b++)
for (var c = "", d = 0; d < 9; d++) {
var e = Math.floor(16 * Math.random());
c += a[e]
}
return c
}
// console.log(j())
nonce解决,回过头在看xyz函数,加密的数据是h,h是我们生成的post需要传递的数据拼接起来在加上nonce的值,调用d函数得到加密的数据,
现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。
分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!