文件从代码到执行经历了哪些过程

作为一名程序员或者学习 C 语言的伙伴们,我们在编写程序的过程中是否曾几何时思过过以下几个问题呢?
1、我们编写的内容电脑为什么就能认识呢?
2、真的就是我们编写什么就执行什么吗?那出错又是什么原因导致的呢?
3、为什么有时候程序执行的结果胡乱跑呢?
4、我们的代码到电脑的执行到底经历了哪些过程呢?
也许起初的时候大家也都思考过,也都想着一探究竟,但是随着时间的流逝,随着一行行代码的编写,把这些最初的想法都磨灭了,更多时候对自己对他人的回答就是,他就是这样运行的,这么写就行了。
下面我们带着这些疑问我们一点点的走下去吧……也许这路还很长,但也只能慢慢的了解下去了,相信随着一点点的积累我们终能找到方向。

一、文件从编写的 C 代码到生成可执行文件中间经历了哪些主要步骤?
1、预处理
所谓预处理是指在进行编译的第一遍扫描(词法扫描和语法分析)之前所做的工作。当编译一个程序时,系统将自动调用预处理程序对程序中 # 号开头的预处理部分进行处理
  1. 头文件展开:将程序中所用的头文件用其内容来替换头文件名。
  2. 宏替换:扫描程序中的符号,将其 替换成宏所定义的内容。
  3. 去注释:去掉程序中的注释。
  4. 条件编译:筛选掉条件编译中的伪命令。
实例分析:
下面图 1-1 中给出了编写的简单程序代码,其中包括头文件、宏定义,条件编译、注释内容,经过预处理后结果为图 1-3 所示:
  1. 头文件展开(1-864 行)
  2. 宏定义去除,同时程序中的 a[M] 变成 a[5]
  3. 源文件中的注释 //查看预处理结果 清除
  4. 条件编译中的伪命令被去除
2、编译
这一阶段经过以下处理后在输出文件中,只有常量、变量的定义,以及C语言的关键字:
  1. 分析词法分析和语法,在确认所有的指令都符合语法规则之后,将其翻译成等价的中间代码表示或汇编代码。
  2. 代码优化:主要是删除公共表达式、循环优化(代码外提、强度削弱、变换循环控制条件、已知量的合并等)、复写传播以及无用赋值的删除,等等。
  3. 目标代码优化:最主要的是考虑是如何充分利用机器的各个硬件寄存器存放的有关变量的值,以减少对于内存的访问次数。另外根据机器硬件执行指令的特点(如流水线、RISC、CISC、VLIW等)而对指令进行一些调整使目标代码比较短,执行的效率比较高。

3、汇编
这一阶段是把汇编语言代码翻译成目标机器指令的过程。目标文件中所存放的也就是与源程序等效的目标的机器语言代码。目标文件由段组成。通常一个目标文件中至少有两个段:
  1. 代码段:该段中所包含的主要是程序的指令,一般是可读和可执行的,但一般却不可写。
  2. 数据段:主要存放程序中要用到的各种全局变量或静态的数据,该段都是可读,可写,可执行的。
UNIX环境下主要有三种类型的目标文件:
  1. 可重定位文件
其中包含有适合于其它目标文件链接来创建一个可执行的或者共享的目标文件的代码和数据。
  1. 共享的目标文件
这种文件存放了适合于在两种上下文里链接的代码和数据。第一种是链接程序可把它与其它可重定位文件及共享的目标文件一起处理来创建另一个目标文件;第二种是动态链接程序将它与另一个可执行文件及其它的共享目标文件结合到一起,创建一个进程映象。
  1. 可执行文件
它包含了一个可以被操作系统创建一个进程来执行之的文件。汇编程序生成的实际上是第一种类型的目标文件。对于后两种还需要其他的一些处理方能得到,这个就是链接程序的工作了。
实例分析:
下图便是以上汇编语言经过汇编生成的二进制文件:


4、链接
完成文件中各种调用的函数以及库的连接,并将它们一起打包合并形成可执行文件。
实例分析:
下图便是以上二进制文件经过链接生成的可执行文件以及执行结果:

以上便是 C 代码到生成可执行文件中间经历的主要步骤,可是这只是一个框架,具体是如何操作的呢?变量是如何调用的?函数是如何调用的?函数中的形参和实参是如何转变的?以及指针又是如何操作的呢?这些都需要我们一一去剖析,去探索,那我们就后面再见了。
  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值