1.前言
今天我们来学习C语言中程序的编译和链接是如何进行的。
在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。 第2种是执行环境,它用于实际执行代码。
2.翻译环境与运行环境
翻译环境
其实翻译环境是由编译和链接两个⼤的过程组成的,⽽编译⼜可以分解成:预处理(有些书也叫预编译)、编译、汇编三个过程。
如下图:
运行环境
程序执行的过程:
① 一般来说,程序先是被操作系统载入到内存中。在独立的环境中,程序的载入也可能是通过可执行代码置入只读内存来完成。
② 程序运行开始,接着便调用 main 函数。
③ 操作系统开始执行程序代码。这个时候程序将使用一个运行时堆栈,用来存储函数的局部变量和返回地址。程序同时也可以使用静态 (static) 内存,存储于静态内存中的变量在程序的整个执行过程一直保留它们的值。
④ 终止程序。操作系统正常终止 main 函数,也有可能是意外终止。
3.预处理(预编译)
3.1.预定义符号
C语言设置了⼀些预定义符号,可以直接使⽤,预定义符号也是在预处理期间处理的。
__FILE__ //进⾏编译的源⽂件
__LINE__ //⽂件当前的⾏号
__DATE__ //⽂件被编译的⽇期
__TIME__ //⽂件被编译的时间
__STDC__ //如果编译器遵循ANSI C,其值为1,否则未定义
3.2. #define定义常量与#define定义宏
首先是#define 定义常量,如下图:
#define 定义宏
如下图:求两个数的最小值,可以通过定义宏的方式来实现
3.3.宏替换的规则与宏与函数的比较
在程序中扩展#define定义符号和宏时,需要涉及几个步骤。
1. 在调⽤宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
2. 替换⽂本随后被插⼊到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
3. 最后,再次对结果⽂件进⾏扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
1. 宏参数和#define?定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。
宏和函数的比较,如下图:
3.4.#和##
#运算符将宏的⼀个参数转换为字符串字⾯量。它仅允许出现在带参数的宏的替换列表中。
#运算符所执⾏的操作可以理解为”字符串化“
#使用方法如下图:
#define PRINT(VALUE,FORMAT) printf("the value of " \
#VALUE "is " FORMAT "\n", VALUE);
int main()
{
int a = 10;
int b = 20;
PRINT(a + b, "%d");
return 0;
}
##运算符
## 可以把位于它两边的符号合成⼀个符号,它允许宏定义从分离的⽂本⽚段创建标识符。 ## 被称
为记号粘合。
这样的连接必须产⽣⼀个合法的标识符。否则其结果就是未定义的。
3.5.带副作用的宏参数
当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:
x + 1;//不带副作用
x++;//带有副作用
例如下面的代码:
#define MAX(a,b) ((a) > (b) ? (a) : (b))
int main()
{
int x = 5;
int y = 8;
int z = MAX(x++, y++);
printf("%d %d %d\n", x, y, z);
return 0;
}
其结果与我们所想要的结果不同,故我们最好不用使用带副作用的宏参数
3.6. #undef
#undef 用于移除一个宏定义,如下面的 error 注释 上面的一行,就是移除了 MAX 这个宏。之后再次使用的时候,就没有 MAX 这个定义了。
#include <stdio.h>
#define MAX(x,y) (x>y?x:y)
#define MIN -100
int main() {
int a = 10;
int b = 20;
int n = MAX(a, b);
// int n = (a>b?a:b);
printf("%d\n", n);
#undef MAX
int n = MAX(a, b);
return 0;
}
3.7.条件编译
在编译⼀个程序的时候我们如果要将⼀条语句(⼀组语句)编译或者放弃是很⽅便的。因为我们有条件编译指令。
调试性的代码,删除可惜,保留⼜碍事,所以我们可以选择性的编译。
大体有如下条件编译:
1.
#if 常量表达式
...
#endif
//常量表达式由预处理器求值。
//2.多个分支的条件编译
#if 常量表达式
...
#elif 常量表达式
...
#else
...
#endif
//3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
//4.嵌套指令
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif
使用的方式有:
int main()
{
int arr[10] = {0};
int i = 0;
for (i = 0; i < 10; i++)
{
arr[i] = i;
#if 1
printf("%d ", arr[i]);
#endif
}
return 0;
}
3.8.头文件的包含
3.8.1文件被包含的两种方式
1.本地⽂件包含
#include "filename"
查找策略:先在源⽂件所在⽬录下查找,如果该头⽂件未找到,编译器就像查找库函数头⽂件⼀样在标准位置查找头⽂件。
如果找不到就提⽰编译错误。
2.库⽂件包含
#include <filename.h>
查找头⽂件直接去标准路径下去查找,如果找不到就提⽰编译错误。
这样是不是可以说,对于库⽂件也可以使⽤ "" 的形式包含
答案是肯定的,可以,但是这样做查找的效率就低些,当然这样也不容易区分是库⽂件还是本地⽂件了。
嵌套头文件
#include "function.h"
#include "function.h"
#include "function.h"
如上所示,如果我们在程序中重复引入头文件,就会在预编译的情况下,带来重复的文本替换。例如上面引入了三个头文件,那么在预编译时,就会存在三个同样的文本替换,这也被称为嵌套了头文件。如果预编译期间存在重复的文本内容,在后续的编译过程中,一定存在效率的降低。那么,如何解决头文件的重复引入呢?
① 使用条件编译解决:
#ifndef __TEST_H__
#define __TEST_H__#endif
② 使用 #pragma:
② 使用 #pragma:
#pragma once
4.结尾
文章到这里就结束了,感谢大家的观看。