要想逆向好,AST不能少,好久没有写章,属实发现自己太菜了,对爬虫天花板有了更新的理解,遂现在对要解决天花板的基础做个简单的记录。
我们先看一下如下混淆代码:
function func (_$eE) {
var _$0n, _$2L, _$sC, _$o9, _$NU, _$qo, _$hK;
var _$tg, _$DM, _$ZZ = 0, _$Ce = [7, 3, 4, 0, 9, 2, 8, 6, 1, 5];
while (1) {
_$DM = _$Ce[_$ZZ++];
if (_$DM < 4) {
if (_$DM < 1) {
_$tg = !_$NU;
} else if (_$DM < 2) {
_$Uy(0);
} else if (_$DM < 3) {
_$NU = _$sC['$_ts'] = {};
} else {
_$sC = window, _$hK = String, _$o9 = Array;
}
} else if (_$DM < 8) {
if (_$DM < 5) {
_$NU = _$sC['$_ts'];
} else if (_$DM < 6) {
_$ZZ += -3;
} else if (_$DM < 7) {
return;
} else {
_$0n = [4, 16, 64, 256, 1024, 4096, 16384, 65536];
}
} else {
if (_$DM < 9) {
_$ZZ += 1;
} else {
if (!_$tg) _$ZZ += 1;
}
}
}
}
现实代码估计比这还繁杂,我们怎么能恢复成真实的代码呢! 哪就得用AST解混淆!
思路如下二种方式:
一:参看while-if转while-switch
转成case需要注意的是为什么每句后面有一个break需要理解。
然后平坦化控制流
二:while-if-else-if转while-if-else结构,然后平坦化
参看添加链接描述
这篇文章着实属于小白的我看不懂,不晓得到了平坦化阶段怎么处理的。这里就不说第二种了。
实战要点:
第一步:需要将取得每一个case{0-9},和case语句:
观察发现只有都是BlockStatement时,并且是$DM
时就达到条件,可以遍历提取。_$DM = _$Ce[_$ZZ++]
这句需要理解,是先运行还是先加后运行。
第二步:将提取的case和case语句生成switch-case节点
const cases = [];
for (let i = 0; i < arrayCase.length; i++) {
const switchCase = types.switchCase( types.numericLiteral(i), caseLine[i]);
cases.push(switchCase);
}
处理后代码成了如下:
function func(_$eE) {
var _$0n, _$2L, _$sC, _$o9, _$NU, _$qo, _$hK;
var _$tg=-1,
_$DM,
_$ZZ = 0,
_$Ce = [7, 3, 4, 0, 9, 2, 8, 6, 1, 5];
while (1) {
switch (_$Ce[_$ZZ++]) {
case 0:
_$tg = !_$NU;
case 1:
_$Uy(0);
case 2:
_$NU = _$sC['$_ts'] = {};
case 3:
_$sC = window, _$hK = String, _$o9 = Array;
case 4:
_$NU = _$sC['$_ts'];
case 5:
_$ZZ += -3;
c
case 6:
return;
case 7:
_$0n = [4, 16, 64, 256, 1024, 4096, 16384, 65536];
case 8:
_$ZZ += 1;
case 9:
if (!_$tg) {
_$ZZ += 1;
}
}
}
}
第三步:平坦化控制流
观察发现有case中有控制分发器的变量会变_$ZZ
如何平坦化呢,此就不能取_$Ce
依次来取语句了,这就要取得如有_$ZZ
的就对_$Ce
的index进行加减来操作,对if-else的就进行判断真假来取得分支再进行平坦化。
就写到这里,需要代码的留言。