计算机语言中一份好的代码,要被执行,要经过两个大的过程,一个是编译,一个是链接。而编译又分为:预处理、编译、汇编,三个过程。
下面看一个程序一步步到可运行文件的过程。
#include<stdio.h>
int main()
{
printf("hello bit!!!");
return 0;
}
在Linux环境下展示:
源代码:
经过gcc预处理编译,即gcc -E指令编译生成.i文件:
预处理过程:会将程序的注释删除,然后将代码所包含的头文件拷贝到代码中,同时“#define”定义的标识符会被替换掉,还有“#define”所定义的宏也会被替换。
例:
#define num 100
printf("num=%d\n",num+100);
经过gcc -E预处理编译后会变成
printf("num=%d\n",100+100);
#define定义的标识符,num会被100替换掉
再经过gcc -S编译,生成.s文件:
这时候的.s文件是原来的c代码编译过来的汇编语言代码,对于编译的三步来说,这第二步编译就是将原来的c代码变成汇编语言
编译过程:第一就是把c源代码变成汇编语言,然后系统会对代码进行,语法分析、词法分析、语义分析、符号汇总。
第三步,执行gcc -c汇编指令,生成.o文件:
这里的.o文件打开是乱码,他其实是经过汇编后生成的二进制文件,使用od -Ax -w8 -tx1 test.o | more指令查看:
经过od指令的打印,我们 能看到刚才的.o文件经过处理使用十六进制打引出来了。
汇编过程:把之前生成的.s文件变成.o文件,也就是把汇编语言转变成电脑可以识别的二进制代码,同时生成符号表。
最后的链接:会生成一个电脑可以执行的二进制代码,打开之后同样是一堆乱码,就不展示了,在这个过程中,编译环境会对之前生成的.o文件进行符号表的合并,符号表的重定位,合并段表。
至此 ,一个c源代码就变成了电脑可以识别并且执行的二进制代码。