编译器编译源代码后生成的文件叫做目标文件。
目标文件从结构上将,它是已经编译后的可执行文件格式,只是还没有经过链接的过程,其中可能有些符号或地址还没有被调整。其实它本身就是按照可执行文件格式存储的,只是跟真正的可执行文件在结构上稍有不同。
3.1 目标文件的格式
目标文件就是源代码编译后但未进行链接的那些中间文件(Windows的.obj和Linux下的.o),它跟可执行文件的内容与结构很相似,所以一般跟可执行文件格式一起采用一种格式存储。
此外,动态链接库(DLL,Dynamic Linking Library)(Windows的.dll和Linuxde 。so)及静态链接库(Static Linking Library)(Windows的.lib和Linux的.a)文件都可按照可执行文件格式存储。静态链接库稍有不同,它是把很多目标文件捆绑在一起形成一个文件,再加上一些索引,可以简单地把它理解为一个包含有很多目标文件的文件包。
3.2 目标文件是什么样的
目标文件中的内容有编译后的机器指令代码、数据,以及链接时所需要的一些信息,如符号表、调试信息、字符串等。一般目标文件将这些信息按照不同的属性,以“节”(Section)恩恩形式存储,有时候也叫“段”(Segment),在一般情况下,他们都表示一个一定长度的区域,基本上不加以区别。
总体来说,程序源代码被编译以后主要分成两种段:程序指令和程序数据。代码段属于程序指令,而数据段和.bss段属于程序数据。
3.3 挖掘.o文件