C语言中的编译和链接

凪よ

已于 2024-01-16 11:05:51 修改

阅读量883

点赞数 22

文章标签： c语言开发语言

于 2024-01-16 11:04:27 首次发布

本文链接：https://blog.csdn.net/2302_79331124/article/details/135615786

版权

1.翻译环境和运行环境

在C语言中，代码从源文件到可执行程序之间都存在两个环境：翻译环境和运行环境。

翻译环境：在这个环境中源代码被转换为可执行的机器指令（二进制指令）。

运行环境：这个环境用于实际执行代码。

上图就是翻译环境和运行环境的一个大致关系。

2.翻译环境

我们知道了翻译环境能够将代码转换为二进制指令，那么它是怎么将代码转换为二进制指令的呢？

其实翻译环境是用编译和链接两个大过程组成的，编译又可以分为：预处理（预编译）、编译、汇编三个过程。

一个C语言项目中可能出现有多个源文件一起构建的情况，那多个源文件是怎么生成可执行程序的呢？

答案是：多个源文件单独经过编译后得到对应的目标文件。

注意：在Windows环境下的目标文件的后缀是.obj，Linux环境下的目标文件的后缀是.o。

多个目标文件和链接库一起经过链接器处理生成可执行程序。

链接库是指运行时库（支持程序运行的基本函数集合）或者第三方库。

如果再把编译器展开成三个过程就如下图所示：

2.1预处理阶段

在预处理阶段，源文件和头文件会被处理为.i为后缀的文件。

在gcc环境下观察的话需要用到命令：

gcc -E test.c -o test.i

gcc test.c -E -o test.i

以上两个命令都可以观察对test.c处理后的.i文件。

预处理阶段主要处理那些源文件中#开头的预处理指令。比如#include，#define，处理规则如下：

将所有的#define删除，并将所有的宏定义展开（替换）

处理所有的条件编译指令，如#if，#ifdef，#elif，#else，#endif

处理#include预编译指令，将包含的头文件的内容插入到这个预编译指令的位置，这个过程是可以递归进行的，也就是被包含的头文件也可能包含其他文件。

将所有的注释用空格替换掉

添加行号和文件名标识，方便后续编译器生成调试信息等

保留所有的#pragma的编译器指令，编译器后续会继续使用

经过预处理后的文件不在包含宏定义，因为宏已经被展开。并且包含的头文件都被插入到.i文件中，可以通过查看.i文件来确定宏定义和头文件的包含是否正确。

2.2编译阶段

编译阶段所做的内容就是将C语言代码翻译成汇代码

编译过程就是将预处理后的.i文件进行一系列的:词法分析，语法分析，语义分析以及优化，生成相应的汇编代码文件。

通过编译后会生成.s文件。

编译过程在gcc下的命令是：

gcc -S test.i -o test.s

gcc test.i -S -o test.s

词法分析：

C语言中的词法分析会将源文件代码输入扫描器，扫描器简单的进行词法分析，将代码中的字符分割成一系列的记号（关键字，标识符，字面量，特殊符号等）。

语法分析：

语法分析器对扫描产生的记号进行语法分析，从而产生语法树。这些语法树是以表达式为节点的树。如下图所示：

语义分析：

由语义分析器，来完成语义分析，即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配，类型的转换等。这个阶段会报告错误的语法信息。

2.3汇编

汇编器是将汇编代码转换位机器可执行的指令，每一条汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表一一的进行翻译，也不做指令优化。

在gcc汇编的命令如下：

gcc -C test.s -o test.o

汇编阶段主要做的内容是将汇编代码翻译成二进制的机器指令，生成.o目标文件。

2.4链接

链接是一个比较复杂的过程，链接的时候需要把一堆文件链接在一起生成一个可执行程序。

链接过程主要包括：地址和空间分配，符号决议和重定位等这些步骤。

链接解决的是一个项目中多文件、多模块之间互相调用的问题。

如下有两个.c文件

.c文件1

#include <stdio.h>
extern int Add(int x, int y);
int main() {
    int a=10;
    int b=20;
    int sum=Add(a,b);
    printf("%d\n",sum);
    return 0;
}

.c文件2

int Add(int x,int y)
{
    return x+y;
}

每个源文件都单独经过编译器处理生成对应的目标文件。

test.c经过编译器处理生成test.o

add.c经过编译器生成add.o

3.运行环境

1.程序必须载入内存中。在有操作系统的环境中：一般这个有操作系统完成，在独立的环境中程序的载入需要手动，也可能是通过可执行代码置入只读内存来完成。

2.程序的执行开始，接着就开始调用main函数。

3.开始执行程序代码，这个时候程序进行函数栈帧，存储函数的局部变量和返回地址，同时程序使用静态内存，存储于静态内存中的变量在程序的整个执行过程中一直保留值。

4.程序终止，正常或者意外终止。

以上就是这篇博客的全部内容，希望有所帮助。

凪よ

关注

22
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫