js逆向-AST技术简介
前面我们介绍了一些javascript混淆的基本知识,可以看到混淆方式多种多样,比如字符串混淆、变量名混淆、对象键名替换、控制流平坦化等,当然,我们也学习了一些相关的调试技巧,比如Hook、断点调试等。但是这些方法本质上其实还是在已经混淆的代码上进行的操作,所以代码的可读性依然比较差。
有没有什么办法可以直接提高代码的可读性呢?比如说,字符串混淆了,我们想办法把它还原了;对象键名替换了,我们想办法把它们重新组装好了,控制流平坦化之后逻辑不直观了,我们想办法把它还原成一个代码控制流。
到底应该怎么做呢?这就需要用到AST相关的知识了。本节中,我们就来了解AST相关的基础知识,并介绍操作AST的相关方法。
9.1 AST介绍
首先,我们来了解什么是AST。AST的全称叫作Abstract Syntax Tree,中文翻译叫作抽象语法树。
如果你对编译原理有所了解的话,一段代码在执行之前,通常要经历这么三个步骤。
- 词法分析:一段代码首先会被分解成一段段有意义的词法单元,比如const name = “msb”这段代码,它可以被拆分成四部分:const、name、=、“msb”,每个部分都具备一定的含义。
- 语法分析:接着编译器会尝试对一个个词法单元进行语法分析,将其转换为能代表程序语法结构的数据结构。比如,const 就被分析为 VariableDeclaration 类型,代表变量声明的具体定义;name就被分析为Identifier类型,代表一个标识符。代码内容多了