许多人将软件逆向工程看做代码逆向工程,然而软件被看做是“软件=代码+数据”。那么对等的就应存在“数据逆向工程”,虽然数据逆向工程与代码逆向工程有交叉部分,但是它们各有侧重。代码逆向工程主要利用反汇编分析代码的执行流程。数据逆向工程重点在于数据结构和数据内容。
二进制文件的数据可以逆向,却不可能反汇编,因为数据连续的静静地躺在栈区和数据段,但为了分析数据,我们又不得不利用代码反汇编,通过代码意图推理出数据结构。
分析方法
1. 黑盒分析:不通过分析代码执行流向,直接观察二进制文件,获取数据结构分析,比如我们经常利用winhex,IDA等软件观察。
2.白盒分析:俗称反汇编,我就不解释了。
代码和数据的区别
假设内存中有字节码53H、56H、75H,若是当指令处理,则表示push ebx、push esi、push edi,当然作为数据也是可以的。
至于如何区分呢?
一般来说通过动态反汇编是最为准确的,当然也可以不必那么复杂,如果你的经验足够丰富黑盒分析有时异常简洁。静态反汇编结合了强两者的优点,但是想IDA这样强大的静态分析软件,也不能100%保证分析正确