一、程序编译过程
1.程序编译过程
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码。
- 每个目标文件由链接器捆绑在一起。形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被程序所用到的函数,而且它可以搜索程序库,将其需要的函数也链接到程序中。
2.编译过程
- 预处理,选项gcc -E test.c -o test.i预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中、
- 编译,选项gcc -S test.c 编译完成之后就停下来了,结果保存在test.c中。
- 汇编,gcc -c test.c汇编完成之后就停下来,结果保存在test.o中。
3.程序执行的过程
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存完成、
- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈,存储函数的局部变量和返回地址。程序同时也使用静态内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
- 终止程序。正常终止main函数;也有可能是意外终止。
二、编译过程详解
1.预处理详解
- 作用:展开头文件,去掉注释,宏展开,宏替换,条件编译。gcc -E test.c -o test.i。
//预定义符号
__FILE__ //进行编译的源文件
__LINE__ //文件当前的行号
__DATE__ //文件被编译的日期
__TIME__ //文件被编译的时间
__STDC__ //如果编译器遵循ANST C,其值为1,否则未定义
(1)#define
- #define定义标识符语法:#define name stuff
- 在define定义标识符的时候,不要在最后加上 ;
//比如
#define MAX 100;
#define MAX 100
- 若上面的两种情况遇到下面的场景
int main()
{
int x = 10;
int max = 0;
if(x > 0)
max = MAX;
else
max = 0;
}
- 如果对于上面的场景,就不可以用#define MAX 100; 此时宏替换之后,就会变成max = 100;;出现了语法错误。
- #define机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏或者定义宏。
- 宏的声明方式:#define name(parament-list) stuff 其中的parament-list是一个由逗号隔开的符号表,它们可能出现在stuff中。注意:参数列表的括号必须与name紧邻。如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
- 对于数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时候由于参数中的操作符或邻近操作符之间不可预料的相互作用。
#include <stdio.h>
#include <stdlib.h>
#define ADD(x) x + x
#define Add(x) ((x) + (x))
int main()
{
int x = 2;
int y = 10 * ADD(x);//10 * 2 + 2
int z = 10 * Add(x);//10 * ((2) + (2))
printf("y = %d , z = %d\n", y, z);
return 0;
}
- 根据上述结果,我们可以得到,对于数值表达式进行求值的宏定义都应该用这种方式加上括号,避免产生逻辑错误。
- #define宏替换在程序中扩展#define定义的符号和宏时,需要涉及几个步骤:(1)在调用宏时,首先对参数进行检查,再看是否包含任何由#define定义的符号。如果是,它们首先被替换。(2)替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值替换。(3)最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
- 注意:(1)宏参数和#define定义中可以出现其他#define定义的变量。但是对于宏,不能出现递归。(2)当预处理搜索#define定义的符号的时候,字符串常量的内容并不被搜索。
(2)# 和 ##
- 使用 # 来完成把一个宏参数变成对应的字符串,如下面代码所示。
#include <stdio.h>
#include <stdlib.h>
#define PRINT_STRING(str) #str
int main()
{
printf(PRINT_STRING(hello world));
printf("\n");
return 0;
}
- 使用 ## 可以把两个参数连接在一起
#include <stdio.h>
#include <stdlib.h>
#define ADD(a, b) int(a##+##b)
#define Add(a, b) ((a) + (b))
int main()
{
printf("%d\n", ADD(3, 2));
printf("%d\n", Add(3, 2));
return 0;
}
(3)宏和函数
- #define MIN(a, b) ((a) < (b) ? (a) : (b))
- 对于上述用法不用函数而用宏函数完成的原因有:① 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏函数比函数在程序的规模和速度方面更胜一筹。 ② 更为重要和是函数的参数必须声明为特定的类型。所以用函数只能在类型合适的表达式上使用。而宏函数是与类型无关的。
- 宏函数与函数比较,劣势在于:① 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。 ② 宏是无法调试的。 ③ 宏由于与类型无关,所以不够严谨。 ④ 宏可能会带来运算符优先级的问题,导致程序容易出错。
(4)带副作用的宏函数
- 当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么在使用这个宏的时候可能出现危险。副作用就是表达式求值的时候出现的永久性效果。
#include <stdio.h>
#include <stdlib.h>
#define MAX(a, b) ((a) > (b) ? (a) : (b))
int main()
{
int x = 5, y = 10;
printf("x = %d, y = %d, z = %d\n", x, y, MAX(x, y));
int z = MAX(x++, y++);//x + 1不带副作用,x++带副作用
printf("x = %d, y = %d, z = %d\n", x, y, z);
return 0;
}
- 如上面代码运行结果可知x、y、z的值不再是我们想要的值了,逻辑紊乱了。
(5)宏和函数的对比(总结)
属性 | #define定义宏 | 函数 |
---|---|---|
代码长度 | 每次使用时,宏都会被插入到程序中。除了非常小的宏之外,程序的长度会大幅度增长 | 函数代码只出现于一个地方;每次使用这个函数时,都调用那个地方的同一份代码 |
执行速度 | 更快 | 存在函数的调用和返回的额外开销,所以相对慢一些 |
操作符优先级 | 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生不可预料的后果,所以建议宏在书写的时候多写括号 | 函数参数只在函数调用的时候求值一次,它的结果值传递给函数。表达式的求值结果更容易预测。 |
带有副作用的参数 | 参数可能被替换到宏体中的多个位置,所以带有副作用的参数求值可能会产生不可预料的结果。 | 函数参数只在传参的时候求值一次,结果更容易控制。 |
参数类型 | 宏的参数与类型无关,只要对参数的操作是合法的,它就可以使用于任何参数类型。 | 函数的参数是与类型有关的,如果参数的类型不同,就需要不同的参数,即使他们执行的任务是不同的。 |
调试 | 宏是不方便调试的。 | 函数是可以逐语句调试的。 |
递归 | 宏是不能递归的。 | 函数是可以递归的。 |
(6)条件编译
- 在编译一个程序的时候,若要将一条语句(一组语句)编译或者放弃是很方便的。因为由条件编译指令。
- 常见的条件编译指令
//常见的条件编译指令
//1.
#if 常量表达式
...
#endif
//2.多个分支的条件编译
#if 常量表达式
...
#else
...
#endif
//3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
//4.嵌套指令
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif
2.编译过程
- 过程:语法、语义纠错,若无错误,则将高级语言解释为汇编语言。gcc -S test.c
3.汇编过程
- 将汇编语言解释为机器指令(二进制机器码)。gcc -c test.c、
4.链接过程
- 将所有文件代码以及库文件中的代码集合打包成可执行程序。