程序执行的四个阶段

程序执行的四个阶段

对于一段helloc.c的程序

#include <stdio.h>

int main()
{
    printf("hello, world\n");
    return 0;
}

为了在系统上运行程序,每条C语句都必须被其他程序转化为一系列的低级机器语言指令。然后这些指令按照一种称为可执行目标程序的格式打好包,并以二进制磁盘文件的形式存放起来。目标程序也称为可执行目标文件。

在Unix系统上,从源文件到目标文件的转化是由编译器驱动程序完成的:

linux> gcc -o hello hello.c

在这里,GCC编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件 hello。这个翻译过程可分为四个阶段完成,如图所示。执行这四个阶段的程序(预处理器、编译器、汇编器和链接器)一起构成了编译系统(compilation system)。
在这里插入图片描述

  • 预处理阶段:预处理器(cpp)根据以字符#开头的命令,修改原始的C程序。比如hello.c中第1行的#include <stdio.h>命令告诉预处理器读取系统头文件stdio.h的内容,并把它直接插入程序文本中。结果就得到了另一个C程序,通常是以.i作为文件扩展名。

  • 编译阶段:编译器(cc1)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。该程序包含函数main的定义,如下所示:

main:
.LFB0:
        .cfi_startproc
        pushq   %rbp
        .cfi_def_cfa_offset 16
        .cfi_offset 6, -16
        movq    %rsp, %rbp
        .cfi_def_cfa_register 6
        movl    $.LC0, %edi
        call    puts
        movl    $0, %eax
        popq    %rbp
        .cfi_def_cfa 7, 8
        ret
        .cfi_endproc

定义中每条语句都以一种文本格式描述了一条低级机器语言指令。汇编语言是非常有用的,因为它为不同高级语言的不同编译器提供了通用的输出语言。例如,C编译器和Fortran编译器产生的输出文件用的都是一样的汇编语言。

  • 汇编阶段:接下来,汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序(relocatable object program)的格式,并将结果保存在目标文件hello.o中。hello.o文件是一个二进制文件,它包含的17个字节是函数main的指令编码。如果我们在文本编辑器中打开hello.o文件,将看到一堆乱码。

  • 链接阶段:请注意,hello程序调用了printf函数,它是每个C编译器都提供的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的he11o.o程序中。链接器(ld)就负责处理这种合并。结果就得到hel1o文件,它是一个可执行目标文件(或者简称为可执行文件),可以被加载到内存中,由系统执行。

如果需要查看程序的各个阶段生成的内容, 可以查看gcc的man帮助

 gcc --help
 // 常用的编译选项,其它内容自行查看
  -E                       Preprocess only; do not compile, assemble or link.
  -S                       Compile only; do not assemble or link.
  -c                       Compile and assemble, but do not link.
  -o <file>                Place the output into <file>.

说明:本系列博文主要参考内容《深入理解计算机系统》经典永远值得仔细阅读!同时也会参考其它书籍及互联网内容。后续本系列更新内容不在赘述。喜欢操作系统系列的可以点赞收藏关注。后续会一直更新!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 1. 预处理阶段:将源代码中的预处理指令(如#include、#define等)进行处理,并将结果输出到一个临时文件中。 2. 编译阶段:将预处理后的文件进行语法析、语义析、中间代码生成等操作,生成目标代码。 3. 汇编阶段:将目标代码转换为汇编代码,即将指令转换为机器码表示。 4. 链接阶段:将汇编代码与库文件等进行链接,生成可执行文件。在这个阶段,如果出现未定义符号,链接器会在库文件中查找并解析它们。 ### 回答2: C语言的编译过程可以四个阶段:预处理、编译、汇编和链接。 1. 预处理阶段:在这个阶段,预处理器根据源代码中的指令和宏定义进行处理。它会展开头文件以及宏定义,并将它们替换为相应的代码。预处理器还会去除代码中的注释,处理条件编译指令,并根据需要插入特定的预编译指令。预处理阶段最终生成一个被预处理后的代码文件。 2. 编译阶段:在编译阶段,编译器会将预处理阶段生成的代码文件进行词法析、语法析和语义析。词法析会将代码解为各个独立的标记或单词,如变量名、关键字和操作符。语法析会根据语法规则检查代码的结构是否正确,并生成一棵语法树。语义析则会对代码进行类型检查和语义析,找出可能的错误和警告。编译阶段的最终输出是一个汇编代码文件。 3. 汇编阶段:在汇编阶段,汇编器会将编译阶段生成的汇编代码翻译成机器语言指令。每条汇编语句都会被翻译成相应的机器语言指令,并生成目标文件。目标文件包含了可执行程序所需的机器指令、符号表和其他重要信息。 4. 链接阶段:在链接阶段,链接器将目标文件与其他必要的库文件进行连接,生成最终的可执行程序。链接器主要完成两项工作:符号解析和地址重定位。符号解析阶段会解析目标文件中引用的外部符号,确定它们的地址。地址重定位阶段会将目标文件中的相对地址转换为绝对地址。链接阶段的最终产出是一个可执行程序,可以在操作系统中直接运行。 四个阶段的顺序是依次进行的,每个阶段的输出作为下一个阶段的输入。通过这四个阶段,C语言的源代码可以经过一系列的处理和转换,最终被转化为可执行的机器语言指令,实现了程序的编译和执行。 ### 回答3: C语言的编译过程可以四个阶段别是预处理、编译、汇编和链接。 1. 预处理:预处理阶段对源代码进行处理,主要包括宏展开、头文件包含、条件编译等操作。C语言中的宏定义、条件编译指令以及头文件引用等都在预处理阶段处理。处理后的代码被称为预处理文件。 2. 编译:编译阶段将预处理文件翻译成汇编代码,采用编译器将C语言的源代码转换为汇编语言。编译器将源代码中的高级语言表示转换成汇编语言的低级表示。编译器将整个代码进行词法析、语法析,并生成汇编代码。 3. 汇编:汇编阶段将汇编代码转换成机器能够识别和执行指令。这个阶段由汇编器完成,将汇编代码转换为可被计算机CPU执行的二进制代码。汇编器将每条汇编指令转换为相应的机器指令,并生成一个目标文件。 4. 链接:链接阶段将目标文件与库文件进行合并,生成可执行文件。在链接阶段,链接器将目标文件以及所需的库文件进行链接,解析符号引用、重定位等操作,生成一个最终的可执行文件。链接器将目标文件中引用的函数和符号与目标文件、库文件中定义的函数和符号进行匹配,并将它们关联起来,生成可以在操作系统上直接执行的最终可执行文件。 通过这四个阶段,C语言的源代码最终被转化为可以在计算机上执行的可执行文件。每个阶段都有特定的任务和目标,彼此之间相互依赖,共同构成了C语言的编译过程。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值