编译和链接

最新推荐文章于 2024-10-01 23:05:47 发布

琪露诺大湿

最新推荐文章于 2024-10-01 23:05:47 发布

阅读量1.9k

点赞数 36

文章标签：算法数据结构 c语言开发语言 c++

本文链接：https://blog.csdn.net/NoobNo2/article/details/137156311

版权

前言

今天给大家带来跟编译和链接有关的博客，参考书籍：《程序员的自我修养》

有问题可以在评论区讨论哈，如果觉得文章有用或者觉得有趣的求求点个免费的赞和关注！

今日封面：

正文开始

1.翻译环境和运行环境简介

在ANSI C的任何⼀种实现中，存在两个不同的环境。

第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令（⼆进制指令）。

第2种是执行环境，它⽤于实际执行代码。

接下来分别我将介绍两个环境

2.翻译环境

翻译环境是如何将源代码转化成可执行的机器指令的呢？

其实，翻译环境由编译和链接两大部分组成，而编译又可以分解成：预处理（预编译）、编译、

汇编三个过程

先来看一个例子：

add.c文件代码:

int add(int a, int b)
{
	return a + b;
}

test.c文件代码:

#include<stdio.h>

/*外部函数声明*/
extern int add(int, int);

int main()
{
	int ret = add(3, 4);
	printf("%d\n", ret);
	return 0;
}

对于这样两个源文件，在编译和链接的过程是怎样的呢？

如图分析：

当一个C项目中含有多个.c文件同时构建时，多个.c将如何生成可执行程序：

①多个.c文件单独经过编译器，编译处理生成对应的目标文件（即图中的.obj文件）。

（注意：在Windows环境下的⽬标⽂件的后缀是 .obj ，Linux环境下⽬标⽂件的后缀是 .o）

②多个目标文件和链接库一起经过链接器处理生成最终的可执行文件。

（链接库是指运⾏时库(它是⽀持程序运行的基本函数集合)或者第三⽅库。）

如果再把编译的过程拆分成预处理（预编译）、编译、汇编三部分，编译的过程如下图所示：

2.1预处理（预编译）

思考：在预处理阶段，编译器具体是如何运行的呢？

在gcc运行环境下执行该代码，生成
gcc -E test.c -o test.i

预处理阶段主要处理那些源⽂件中#开始的预编译指令。⽐如:#include,#define，处理的规则如下：

① 将所有的 #define 删除，并展开所有的宏定义。

② 处理所有的条件编译指令，如： #if 、 #ifdef 、 #elif 、 #else 、 #endif 。

③ 处理#include 预编译指令，将包含的头⽂件的内容插⼊到该预编译指令的位置。

这个过程是递归进⾏的，也就是说被包含的头⽂件也可能包含其他⽂件。

④ 删除所有的注释

⑤ 添加⾏号和⽂件名标识，⽅便后续编译器⽣成调试信息等。

⑥ 或保留所有的#pragma的编译器指令，编译器后续会使⽤。

经过预处理后的.i⽂件中不再包含宏定义，因为宏已经被展开。并且包含的头⽂件都被插⼊到.i⽂件

中。所以当我们⽆法知道宏定义或者头⽂件是否包含正确的时候，可以查看预处理后的.i⽂件来确认。

2.2编译

编译过程就是将预处理后的⽂件进⾏⼀系列的：词法分析、语法分析、语义分析及优化，⽣成相应的汇编代码⽂件。

编译过程的命令如下：

gcc -S test.i -o test.s

举一个例子：

对下面这段代码进行编译，它的编译的过程是怎么样的呢?

array[index] = (index+4)*(2+6);

2.2.1词法分析

对这段代码进行编译，经过的第一个历程就是词法分析。

词法分析：

将源代码程序被输⼊扫描器，扫描器的任务就是简单的进行词法分析，把代码中的字符分割成⼀系列的记号（关键字、标识符、字⾯量、特殊字符等）。

array[index] = (index+4)*(2+6);

对上面这段代码进行词法分析，可以拆分成16个记号，为了方便观察，我将其列为表格：

记号	类型
array	标识符
[	左方括号
index	标识符
]	右方括号
=	赋值
(	左圆括号
index	标识符
+	加号
4	数字
)	右圆括号
*	乘号
(	左圆括号
2	数字
+	加号
6	数字
)	右圆括号

2.2.2语法分析

完成了词法分析，接下来就进入到语法分析部分。

接下来的语法分析器，将对扫描产生的记号进行语法分析，从而产生语法树。这些语法树是 以表达式为节点 的树。

array[index] = (index+4)*(2+6);

继续对上面的代码进行语法分析：

以表达式为节点对代码进行分析，可从中间开始依次拆分为(如上图所示)。

2.2.3语义分析

当把整段代码拆分成一段段表达式后，再对每个表达式进行语义分析。

由语义分析器来完成语义分析，即对表达式的语法层⾯分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配，类型的转换等。这个阶段会报告错误的语法信息。

语义分析，就是对表达式左右的对象进行类型匹配，若类型不符就报错。

就比如图中的赋值表达式（=），表达式两边都为整形则符合类型匹配，如果左边为char右边为int则报错。

2.3汇编

代码完成了编译过程，结果会生成汇编代码。

而汇编过程，就是再将汇编代码转化成机器可执行的指令。

汇编器将汇编代码转变成机器可执⾏的指令，每⼀个汇编语句⼏乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表一一进行翻译，不做指令优化。

汇编的命令如下：

gcc -c test.s -o test.o

2.4链接

如果说预处理，编译，汇编是为了将一个源文件代码翻译成机器可执行的命令。

那么链接就是将一堆源文件链接在一起形成一个可执行的程序。

链接过程主要包括：地址和空间分配，符号决议和重定位等这些步骤。

链接解决的是⼀个项⽬中 多⽂件、多模块 之间互相调⽤的问题。

以下就以add.c和test.c这两个源文件为例，看看链接过程是怎么样的。

//test.c文件

#include<stdio.h>
//声明外部函数
extern int add(int x, int y);
//声明外部变量
extern int g_val;

int main()
{
   int a = 10;
   int b = 20;
   int ret = add(a, b);

   printf("%d\n", ret);

   printf("%d\n", g_val);
   return 0;
}