python爬取美之图美女图(JS逆向)
网址
美之图:aHR0cHM6Ly9tbXp6dHQuY29tLw==
首先了解hook技术
Hook 是一种钩子技术,在系统没有调用函数之前,钩子程序就先得到控制权,这时钩子函数既可以加工处理(改变)该函数的执行行为,也可以强制结束消息的传递。简单来说,修改原有的 JS 代码就是 Hook。
Hook 技术之所以能够实现有两个条件:
- 客户端拥有 JS 的最高解释权,可以决定在任何时候注入 JS,而服务器无法阻止或干预。服务端只能通过检测和混淆的手段,另 Hook 难度加大,但是无法直接阻止。
- 除了上面的必要条件之外,还有一个条件。就是 JS 是一种弱类型语言,同一个变量可以多次定义、根据需要进行不同的赋值,而这种情况如果在其他强类型语言中则可能会报错,导致代码无法执行。js 的这种特性,为我们 Hook 代码提供了便利。
hook解决无限debugger问题
首先利用f12打开开发者工具,会发现,这个网站有无限debugger反调试,
我们可以在控制台运行以下代码,并点击运行,这样就可以跳过debugger
AAA = Function.prototype.constructor;
Function.prototype.constructor = function(a) {
if (a == "debugger") {
return function() {
}
;
}
return AAA(a);
}
;
网页抓包
选择一套图片,在点击一张图片放大的时候,我们会发现,接口返回的数据是经过加密的
接口的参数应该就是这套图片的id
Hook JSON
JSON.stringify() 方法用于将 JavaScript 值转换为 JSON 字符串,在某些站点的加密过程中可能会遇到,以下代码演示了遇到 JSON.stringify() 时,则插入断点;JSON.parse() 方法用于将一个 JSON 字符串转换为对象,在某些站点的加密过程中可能会遇到,以下代码演示了遇到 JSON.parse() 时,则插入断点。
在网页控制台运行这段代码,以便后续抓包
(
function () {
var my_strintgify = JSON.stringify;
JSON.stringify = function (params) {
console.log("Hook stringify", params);
debugger;
return my_strintgify(params);
}
var my_parse=JSON