C/C++程序编译流程(预处理->编译->汇编->链接)/////文件从代码到执行经历了哪些过程?

作为一名程序员或者学习 C 语言的伙伴们,我们在编写程序的过程中是否曾几何时思过过以下几个问题呢?
1、我们编写的内容电脑为什么就能认识呢?
2、真的就是我们编写什么就执行什么吗?那出错又是什么原因导致的呢?
3、为什么有时候程序执行的结果胡乱跑呢?
4、我们的代码到电脑的执行到底经历了哪些过程呢?
也许起初的时候大家也都思考过,也都想着一探究竟,但是随着时间的流逝,随着一行行代码的编写,把这些最初的想法都磨灭了,更多时候对自己对他人的回答就是,他就是这样运行的,这么写就行了。
下面我们带着这些疑问我们一点点的走下去吧……也许这路还很长,但也只能慢慢的了解下去了,相信随着一点点的积累我们终能找到方向。

一、文件从编写的 C 代码到生成可执行文件中间经历了哪些主要步骤?
1、预处理
所谓预处理是指在进行编译的第一遍扫描(词法扫描和语法分析)之前所做的工作。当编译一个程序时,系统将自动调用预处理程序对程序中 # 号开头的预处理部分进行处理
  1. 头文件展开:将程序中所用的头文件用其内容来替换头文件名。
  2. 宏替换:扫描程序中的符号,将其 替换成宏所定义的内容。
  3. 去注释:去掉程序中的注释。
  4. 条件编译:筛选掉条件编译中的伪命令。
实例分析:
下面图 1-1 中给出了编写的简单程序代码,其中包括头文件、宏定义,条件编译、注释内容,经过预处理后结果为图 1-3 所示:
  1. 头文件展开(1-864 行)
  2. 宏定义去除,同时程序中的 a[M] 变成 a[5]
  3. 源文件中的注释 //查看预处理结果 清除
  4. 条件编译中的伪命令被去除
2、编译
这一阶段经过以下处理后在输出文件中,只有常量、变量的定义,以及C语言的关键字:
  1. 分析词法分析和语法,在确认所有的指令都符合语法规则之后,将其翻译成等价的中间代码表示或汇编代码。
  2. 代码优化:主要是删除公共表达式、循环优化(代码外提、强度削弱、变换循环控制条件、已知量的合并等)、复写传播以及无用赋值的删除,等等。
  3. 目标代码优化:最主要的是考虑是如何充分利用机器的各个硬件寄存器存放的有关变量的值,以减少对于内存的访问次数。另外根据机器硬件执行指令的特点(如流水线、RISC、CISC、VLIW等)而对指令进行一些调整使目标代码比较短,执行的效率比较高。

3、汇编
这一阶段是把汇编语言代码翻译成目标机器指令的过程。目标文件中所存放的也就是与源程序等效的目标的机器语言代码。目标文件由段组成。通常一个目标文件中至少有两个段:
  1. 代码段:该段中所包含的主要是程序的指令,一般是可读和可执行的,但一般却不可写。
  2. 数据段:主要存放程序中要用到的各种全局变量或静态的数据,该段都是可读,可写,可执行的。
UNIX环境下主要有三种类型的目标文件:
  1. 可重定位文件
其中包含有适合于其它目标文件链接来创建一个可执行的或者共享的目标文件的代码和数据。
  1. 共享的目标文件
这种文件存放了适合于在两种上下文里链接的代码和数据。第一种是链接程序可把它与其它可重定位文件及共享的目标文件一起处理来创建另一个目标文件;第二种是动态链接程序将它与另一个可执行文件及其它的共享目标文件结合到一起,创建一个进程映象。
  1. 可执行文件
它包含了一个可以被操作系统创建一个进程来执行之的文件。汇编程序生成的实际上是第一种类型的目标文件。对于后两种还需要其他的一些处理方能得到,这个就是链接程序的工作了。
实例分析:
下图便是以上汇编语言经过汇编生成的二进制文件:


4、链接
完成文件中各种调用的函数以及库的连接,并将它们一起打包合并形成可执行文件。
实例分析:
下图便是以上二进制文件经过链接生成的可执行文件以及执行结果:

以上便是 C 代码到生成可执行文件中间经历的主要步骤,可是这只是一个框架,具体是如何操作的呢?变量是如何调用的?函数是如何调用的?函数中的形参和实参是如何转变的?以及指针又是如何操作的呢?这些都需要我们一一去剖析,去探索,那我们就后面再见了。

原文链接:https://blog.csdn.net/wenfei11471/article/details/79587539


程序的基本流程如图:

wKioL1cDsP_goUwlAAAlcbFkNbs906.png

1. 预处理

预处理相当于根据预处理指令组装新的C/C++程序。经过预处理,会产生一个没有宏定义,没有条件编译指令,没有特殊符号的输出文件,这个文件的含义同原本的文件无异,只是内容上有所不同。

  • 读取C/C++源程序,对其中的伪指令(以#开头的指令)进行处理

    ①将所有的“#define”删除,并且展开所有的宏定义

    ②处理所有的条件编译指令,如:“#if”、“#ifdef”、“#elif”、“#else”、“endif”等。这些伪指令的引入使得程序员可以通过定义不同的宏来决定编译程序对哪些代码进行处理。预编译程序将根据有关的文件,将那些不必要的代码过滤掉。 

    ③处理“#include”预编译指令,将被包含的文件插入到该预编译指令的位置。

(注意:这个过程可能是递归进行的,也就是说被包含的文件可能还包含其他文件)

  • 删除所有的注释

  • 添加行号和文件名标识。

    以便于编译时编译器产生调试用的行号信息及用于编译时产生的编译错误或警告时能够显示行号

  • 保留所有的#pragma编译器指令

2. 编译

将预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后,产生相应的汇编代码文件。

3. 汇编

将编译完的汇编代码文件翻译成机器指令,并生成可重定位目标程序的.o文件,该文件为二进制文件,字节编码是机器指令。

汇编器是将汇编代码转变成机器可以执行的指令,每一个汇编语句几乎都对应一条机器指令。所以汇编器的汇编过程相对于编译器来讲比较简单,它没有复杂的语法,也没有语义,也不需要做指令优化,只是根据汇编指令和机器指令的对照表一一翻译即可。

4. 链接

通过链接器将一个个目标文件(或许还会有库文件)链接在一起生成一个完整的可执行程序。

    由汇编程序生成的目标文件并不能立即就被执行,其中可能还有许多没有解决的问题。

例如,某个源文件中的函数可能引用了另一个源文件中定义的某个符号(如变量或者函数调用等);在程序中可能调用了某个库文件中的函数,等等。所有的这些问题,都需要经链接程序的处理方能得以解决。

    链接程序的主要工作就是将有关的目标文件彼此相连接,也就是将在一个文件中引用的符号同该符号在另外一个文件中的定义连接起来,使得所有的这些目标文件成为一个能够被操作系统装入执行的统一整体。

 

至此,大致经过这几个步骤,一个完整的可执行程序产生了。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值