Python爬虫进阶必备,某著名人均百万问答社区header参数加密逻辑分析。

参数 E 的值是个 null , b.body 是个 undefine

接下来就只剩下 i.default 未知了,所以单步进去分析可以看到在这个 i.default 方法中最终返回了 signature ,这个 signature 就是我们需要的加密值

这个 signature 的逻辑如下

signature = (0,o.default)((0,r.default)(d))

这里传入的 d 就是上面的参数拼接起来的

这里又多了两个未知的方法, o.default 与 r.default

先看看第一个方法 r.default

单步进去的逻辑如下

function m(e, t, n) {return t ? n ? O(t, e) : h(O(t, e)) : n ? v(e) : h(v(e))}

这里是一些三元表达式,最终返回的是 h(v(e))

这个方法比较简单的,其实就是将上面的 d 取 md5 hash 的操作

得到 r.default 的结果后传入 o.default

进入的是下面这个逻辑

var b = function(e) {return __g._encrypt(encodeURIComponent(e))};

这里用到了 r() 方法

分析这个方法我们可以自己慢慢把全部的逻辑抠出来,也可以像我一样把这个 js 文件复制到本地,会发现全部的逻辑都在一个 function 中。

把这段代码拿到浏览器中运行

是可以正常得到结果的,那我们要把这个代码在 node 中运行看看

加密改写

在 node 里运行结果我改了改了,保证他可以运行不报错

首先直接将代码复制过来运行是会报错的

简单修改下,声明 window ,并把最后的 exports 修改为 window.exports

修改后调用发现报错 atob 未定义

这个应该大家都会吧,其实就是 base64,补的方法有很多种

方法 1 :

_keyStr = “ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=”;

function _utf8_encode (string) {

var string = string.replace(/\r\n/g,“\n”);

var utftext = “”;

for (var n = 0; n < string.length; n++) {

var c = string.charCodeAt(n);

if (c < 128) {

utftext += String.fromCharCode©;

} else if((c > 127) && (c < 2048)) {

utftext += String.fromCharCode((c >> 6) | 192);

utftext += String.fromCharCode((c & 63) | 128);

} else {

utftext += String.fromCharCode((c >> 12) | 224);

utftext += String.fromCharCode(((c >> 6) & 63) | 128);

utftext += String.fromCharCode((c & 63) | 128);

}

}

return utftext;

}

function _utf8_decode (utftext) {

var string = “”;

var i = 0;

var c = 0;

var c1 = 0;

var c2 = 0;

var c3 = 0;

while ( i < utftext.length ) {

c = utftext.charCodeAt(i);

if (c < 128) {

string += String.fromCharCode©;

i++;

} else if((c > 191) && (c < 224)) {

c2 = utftext.charCodeAt(i+1);

string += String.fromCharCode(((c & 31) << 6) | (c2 & 63));

i += 2;

} else {

c2 = utftext.charCodeAt(i+1);

c3 = utftext.charCodeAt(i+2);

string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63));

i += 3;

}

}

return string;

}

var xazxBase64 = {

‘decode’: function (input){

output = “”;

var chr1, chr2, chr3;

var enc1, enc2, enc3, enc4;

i = 0;

input = input.replace(/[^A-Za-z0-9+/=]/g, “”);

while (i < input.length) {

enc1 = _keyStr.indexOf(input.charAt(i++));

enc2 = _keyStr.indexOf(input.charAt(i++));

enc3 = _keyStr.indexOf(input.charAt(i++));

enc4 = _keyStr.indexOf(input.charAt(i++));

chr1 = (enc1 << 2) | (enc2 >> 4);

chr2 = ((enc2 & 15) << 4) | (enc3 >> 2);

chr3 = ((enc3 & 3) << 6) | enc4;

output = output + String.fromCharCode(chr1);

if (enc3 !== 64) {

output = output + String.fromCharCode(chr2);

}

if (enc4 !== 64) {

output = output + String.fromCharCode(chr3);

}

}

output = _utf8_decode(output);

return output;

},

‘encode’: function (input){

output = “”;

var chr1, chr2, chr3, enc1, enc2, enc3, enc4;

i = 0;

input = _utf8_encode(input);

while (i < input.length) {

chr1 = input.charCodeAt(i++);

chr2 = input.charCodeAt(i++);

chr3 = input.charCodeAt(i++);

enc1 = chr1 >> 2;

enc2 = ((chr1 & 3) << 4) | (chr2 >> 4);

enc3 = ((chr2 & 15) << 2) | (chr3 >> 6);

enc4 = chr3 & 63;

if (isNaN(chr2)) {

enc3 = enc4 = 64;

} else if (isNaN(chr3)) {

enc4 = 64;

}

output = output +

_keyStr.charAt(enc1) + _keyStr.charAt(enc2) +

_keyStr.charAt(enc3) + _keyStr.charAt(enc4);

}

return output;

}

};

方法 2 :

global.Buffer = global.Buffer || require(‘buffer’).Buffer;

if (typeof btoa === ‘undefined’) {

global.btoa = function (str) {

return new Buffer.from(str, ‘binary’).toString(‘base64’);

};

}

if (typeof atob === ‘undefined’) {

global.atob = function (b64Encoded) {

return new Buffer.from(b64Encoded, ‘base64’).toString(‘binary’);

};

}

方法 3 :

var atob = function® {

e = “ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=”;

var o = String®.replace(/=+$/, “”);

if (o.length % 4 == 1)

throw new t(“‘atob’ failed: The string to be decoded is not correctly encoded.”);

for (var n, a, i = 0, c = 0, d = “”; a = o.charAt(c++); ~a && (n = i % 4 ? 64 * n + a : a,

i++ % 4) ? d += String.fromCharCode(255 & n >> (-2 * i & 6)) : 0)

a = e.indexOf(a);

return d

}

jsdom 版生成正确加密值

这个是网上流传最多的版本,其实也没有毛病,直接用 jsdom 套个环境就完事了

使用方法也非常简单

npm install jsdom

在代码开头加上下面的代码

const jsdom = require(“jsdom”);

const { JSDOM } = jsdom;

const dom = new JSDOM(<!DOCTYPE html><p>Hello world</p>);

window = dom.window;

document = window.document;

XMLHttpRequest = window.XMLHttpRequest;

直接运行可以得到下面的结果

输入值

127927b6d4c1814afa22cdea9c7d7be9

正确结果

aHt0c6Lyn9Ox28S8K0OqNJuqb0FYoXYBG8F0b7uySRYf

jsdom的结果

aHt0c6Lyn9Ox28S8K0OqNJuqb0FYoXYBG8F0b7uySRYf

node 版生成正确的加密值

如果要使用 node 生成正确的加密 结果

推荐采用方法 2,可以直接得到近似结果,但是结果是多了最后的 4 位,偷懒一点直接截掉后四位就行了

输入值

c06829267e17d3941f5c4cf33db9d509

正确结果

aHt0c6Lyn9Ox28S8K0OqNJuqb0FYoXYBG8F0b7uySRYf

我们自己的结果

aHt0c6Lyn9Ox28S8K0OqNJuqb0FYoXYBG8F0b7uySRYf9Tuw

截掉后四位就完事了

想知道一步到位的方法就需要一点点分析分析他的加密了

如果不想分析的接下来的部分可以跳过

主要内容已经全部讲完了,剩下的内容没有代码

接下来主要会告诉你分析插桩的点在哪里

先看加密的入口

__g._encrypt(encodeURIComponent(e))

这里的 __g._encrypt 是 r()

r 是在下面这里调用的

这里用到了 o.v 这里的 o.v 是由 new G.v 生成的

就是代码里的一长串 base64 编码

传入这一串编码之后就在 G.prototype.D 和 G.prototype.v 来回跳转,并且在这两个方法做一些判断,移位的操作最后生成最后的结果

能插桩看到信息的点在哪里呢?

全局检索 var k

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img



既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
img

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

img
img

二、Python必备开发工具

工具都帮大家整理好了,安装就可直接上手!img

三、最新Python学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

img

四、Python视频合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

img

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。img

六、面试宝典

在这里插入图片描述

在这里插入图片描述

简历模板在这里插入图片描述

mg](https://img-blog.csdnimg.cn/6d414e9f494742db8bcc3fa312200539.png)

四、Python视频合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

img

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。img

六、面试宝典

在这里插入图片描述

在这里插入图片描述

简历模板在这里插入图片描述
  • 14
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值