编译与链接:从源代码到可执行程序

1、翻译环境和运行环境

        在ANSI C的任何⼀种实现中,存在两个不同的环境。(ANSI C是由美国国家标准协会(ANSI)及国际标准化组织(ISO)推出的关于C语言的标准。)

        第1种:翻译环境,在这个环境中源代码被转换为可执行的机器指令。

        翻译环境是指在计算机系统中,将源代码转换为可执行的机器指令的过程和环境。在这个环境中,编译器或解释器等工具会对源代码进行解析、语法分析、语义分析和优化等操作,最终生成可执行的机器指令或字节码。这个过程通常包括以下几个步骤:

1. 词法分析:将源代码分解成一个个词法单元,如标识符、关键字、运算符等。

2. 语法分析:根据语法规则将词法单元组织成语法树,确定代码的结构和层次关系。

3. 语义分析:对语法树进行语义检查,确保代码的合法性和正确性,如类型检查、作用域分析等。

4. 优化:对代码进行优化,以提高执行效率和减少资源消耗,例如常量折叠、循环展开等。

5. 代码生成:将优化后的中间表示转换为目标机器的机器指令或字节码。

6. 目标代码生成:根据目标机器的特性和限制,生成可执行的机器指令或字节码。

翻译环境的目标是将源代码转换为可执行的机器指令,以便计算机能够理解和执行。

        第2种:执行环境,它用于实际执行代码。

        执行环境是指在计算机系统中,用于实际执行代码的运行时环境。它提供了必要的资源和支持,使得计算机能够按照指令执行代码,并且能够获取和操作所需的数据。执行环境包括以下几个方面:

1. 内存管理:执行环境会分配内存空间来存储代码、变量、函数和其他数据结构。它负责管理内存的分配和释放,以确保代码和数据的正确访问和使用。

2. 进程和线程管理:执行环境可以创建和管理进程和线程,以实现并发执行和多任务处理。它可以控制代码的执行顺序,调度和分配计算资源。

3. 输入输出:执行环境可以处理输入和输出操作,包括读取和写入文件、网络通信、显示图形界面等。它提供了对外部设备和资源的访问接口。

4. 异常处理:执行环境可以捕获和处理代码执行过程中的异常和错误。它提供了机制来检测和处理运行时错误,以保证程序的稳定性和可靠性。

5. 安全性和权限控制:执行环境可以实施安全策略和权限控制,以保护系统和数据的安全。它可以限制代码的访问权限,防止恶意操作和非法访问。

执行环境的设计和实现取决于具体的计算机系统和操作系统,不同的编程语言和应用程序可能使用不同的执行环境。

        

2、翻译环境

        其实翻译环境是由编译和链接两个大的过程组成的,而编译又可以分解成:预处理(有些书也叫预编译)、编译、汇编三个过程。

⼀个C语言的项目中可能有多个.c文件一起构建。
多个.c文件单独经过编译出编译处理产生对应的目标文件。
注:在Windows环境下的目标文件的后缀是.obj,Linux环境下目标文件的后缀是.o。
多个目标文件和链接库⼀起经过链接器处理生成最终的可执行程序。
链接库是指运行时库(它是支持程序与运行的基本函数集合)或者第三方库。

        过程:

2.1、预处理(预编译)

        编译过程就是将预处理后的文件进行⼀系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。


        在 gcc 环境下想观察⼀下,对 mian.c 文件预处理后的.i文件,命令如下::

 1|    gcc -E test.c -o test.i 

预处理阶段主要处理源文件中以开头的预编译指令。例如:#include,#define

处理的规则如下:
• 删除所有的#define,并展开所有的宏定义。
• 处理所有的条件编译指令,如:#if、#ifdef、#elif、#else、#endif
• 处理#include预编译指令,将包含的头文件的内容插入到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。
• 删除所有的注释。
• 添加行号和文件名标识,方便后续编译器生成调试信息等。
• 可选地保留所有的#pragma编译器指令,供编译器后续使用。
经过预处理后的.i文件中不再包含宏定义,因为宏已经被展开。并且包含的头文件都被插入到.i文件中。所以当我们无法知道宏定义或者头文件是否包含正确的时候,可以查看预处理后的.i文件来确认。

 我们以宏展开条件编译举个例子:

        宏展开(Macro Expansion):

源代码文件main.c:

#include <stdio.h>

#define MAX(a, b) ((a) > (b) ? (a) : (b))

int main() {
    int x = 10;
    int y = 20;
    int max = MAX(x, y);

    printf("The maximum value is: %d\n", max);

    return 0;
}

预处理后的代码:

int main() {
    int x = 10;
    int y = 20;
    int max = ((x) > (y) ? (x) : (y));

    printf("The maximum value is: %d\n", max);

    return 0;
}

        条件编译(Conditional Compilation):

源文件mian.c:

#include <stdio.h>

#define DEBUG

int main() {
    #ifdef DEBUG
        printf("Debug mode enabled.\n");
    #else
        printf("Debug mode disabled.\n");
    #endif

    return 0;
}

预处理后的代码(假设没有定义 DEBUG):

int main() {
    printf("Debug mode disabled.\n");

    return 0;
}
2.2、编译

        编译过程就是将预处理后的文件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。

编译过程的命令如下:

1|  gcc -S test.i -o test.s

假设有一段这样的代码,对其预编译会得到什么呢?

1|  array[index] = (index+4)*(2+6); 
2.2.1、.词法分析

        将源代码程序被输⼊扫描器,扫描器的任务就是简单的进⾏词法分析,把代码中的字符分割成⼀系列的记号(关键字、标识符、字⾯量、特殊字符等)。

对上面的代码进行此法分析后的得到16个记号:

2.2.2、语法分析

        语法分析器,将对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树。

2.2.3、语义分析

语义分析器来完成语义分析,即对表达式的语法层⾯分析。编译器所能做的分析是语义的静态分
析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。

2.3、汇编

        汇编器是将汇编代码转转变成机器可执行的指令,每⼀个汇编语句几乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表一一的进行翻译,也不做指令优化。
汇编的命令如下:

1|  gcc -c test.s -o test.o 

2.4、链接

        链接是⼀个复杂的过程,链接的时候需要把⼀堆文件链接在⼀起才生成可执行程序。
        链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
        链接解决的是⼀个项目中多文件、多模块之间互相调用的问题。

在⼀个C的项目中有2个.c文件( contact.c 和 mycontact.c ):

在编译过程中,每个源文件都会被单独编译成对应的目标文件。

对于contact.c文件,编译器会将其编译成contact.o目标文件;对于mycontact.c文件,编译器会将其编译成mycontact.o目标文件。

mycontact.c文件中,我们需要使用contact.c文件中的函数来实现通讯录功能。因此,在mycontact.c文件中,我们会包含contact.c文件的头文件,以便在编译过程中能够正确地识别并调用其中定义的函数。

在链接过程中,链接器会将contact.omycontact.o这两个目标文件合并成一个可执行文件。在这个过程中,链接器会解析函数的引用,并将其与函数的定义进行匹配。具体来说,在mycontact.c文件中调用contact.c文件中定义的函数时,编译器会生成对这些函数的引用指令,但并不知道它们的确切地址。这是因为编译器在编译mycontact.c文件时并没有访问contact.c文件,所以无法确定这些函数的地址。在链接过程中,链接器会根据引用的符号(例如contact.c中定义的函数)在其他模块中查找它们的地址。一旦找到了这些地址,链接器会将mycontact.c中所有引用到contact.c中函数的指令重新修正,使它们的目标地址指向真正的函数的地址。

这个地址修正的过程也被称为 重定位。

3、运行环境

1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载⼊必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
2. 程序的执行便开始。接着便调用main函数。
3. 开始执⾏程序代码。这个时候程序将使用⼀个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。
4. 终止程序。正常终止main函数;也有可能是意外终止。

  • 19
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 17
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值