@(C语言)[code]
用一段简单的代码,探讨下从C代码到最终可执行文件的编译过程,追根究底。
偶尔了解下底层,也就没那么多莫名其妙了。
工作原因有时候会用python写写测试工具,感受到其快速实现应用的便利,但由于偏底层开发,主力语言依然是C。对于开发语言没有什么优劣概念,在特定的情景下哪种实现更佳就用哪种,工具合适才是最好的。
个人开发环境 ubuntu 14.04
编译的作用
相比python,lua等脚本语言解释执行方式,编译C是为了提高程序的运行效率。把对用户友好的语言文本编译成对机器友好的特定指令直接执行,而不是执行时一条一条通过解释器解析执行,很大地提高了执行的效率。对应C主要用于底层,系统层次,追求高性能表现,亦或者,平台资源限制。
编译的过程
gcc 的编译流程分为四个步骤:
计算机系统设计基本原则:层次化和抽象。
编写一个最简单的程序 hell.c,以此为例,看看各个过程做了什么事情。
#include<stdio.h>
#define NUM(x) ((x) + 1)
int main(void)
{
printf("Hello world %d\r\n", NUM(1));
return 0;
}
预处理(Pre-Processing)
预处理主要完成的工作:
- 根据
#i
后面的条件决定需要编译的代码 - 将源文件中
#include
格式包含的文件直接复制到编译的源文件中 - 用实际值替换用
#define
定义的字符串
对源代码进行预处理操作
$ gcc -E hello.c -o hello.i
使用编辑器打开输出hello.i,一看吓一跳,原本7、8的代码变成800多行
截取开头结尾如下
# 1 "hello.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "<command-line>" 2
...
...
int main(void)
{
printf("Hello world %d\r\n", ((1) + 1));
return 0;
}
我打开文件 stdio.h 对比发现,hello.i 文件开头多出来的一大堆东西,就是stdio.h 经过#if
条件选择后留下的(包括其他包含文件的展开,同理)。同时在最下面看到熟悉的printf函数中定义的宏被直接
替换成对应的文本。
在这里提出两个问题
- 预处理宏展开可能陷入死循环?
我修改了了代码, 宏里面调用了自己,并且没有递归退出条件
#include<stdio.h>
#define NUM(x) (NUM(x) + 1)
int main(void)
{
printf("Hello world %d\r\n", NUM(1));
return 0;
}
输出hello.i可以看到,宏展开遇到自己就会停止,避免陷入死循环
int main(void)
{
printf("Hello world %d\r\n", (NUM(1) + 1));
return 0;
}
- #include 包含头文件重复?
预处理会直接把对应的头问题展开,如果包含的头文件本身包含了自己,是否也会陷入死循环? 简单编写文件测试
inc.h 文件
#include "inc.h"
inc.c 文件