代码混淆技术
代码混淆亦称花指令,是将计算机程序的代码,转换成一种功能上等价,但是难于阅读和理解的形式的行为。代码混淆可以用于程序源代码,也可以用于程序编译而成的中间代码。执行代码混淆的程序被称作代码混淆器。已经存在许多种功能各异的代码混淆器。
在编译的过程中,有以下流程:源程序 - > 前端 - > 中间代码 - > 代码优化器 - > 中间代码 - > 代码生成器 - > 目标程序,混淆,就是代码优化器的逆过程。混淆技术分为两类:一类是基于控制流的混淆;一类是基于数据流的混淆。
- 基于控制流的代码混淆技术
1.常量展开。编译器在编译时,会把那些在每次运行时总是得到相同常量值的表达式替换为该常量值。对代码进行混淆时,我们可以提取出一些指令的立即数,对其进行展开。
2.恒等运算。存在一些运算是恒等运算,通过将简洁的指令替换为复杂的指令,可以大大增加分析者的分析难度。
3.模式替换。窥孔优化的逆操作。通过模式替换实现代码等价转换,此外此过程可以不断重复,实现多次代码混淆。
- 基于数据流的代码混淆技术
1.控制流平伸法。控制流平伸法的思想是打消原程序块之间的逻辑关系,使所有块都呈现出具有相同的前趋或后继节点。而在程序执行过程中的控制流主要领先分支变量来决定。每个块是否执行是由分支变量来确定的。