用C/C++语言这类高级编程语言所编写的程序源码是利用一种叫做“编译原理”的技术,经过一些列的处理步骤,最终转变为汇编指令,再最后翻译机器指令。我们知道计算机只能处理和识别二进制指令,而我们所编写的程序包含各种较复杂的结构,例如 if语句、循环语句、继承、多态、虚函数等。其实,在很早的时候,计算机科学家们就已经在研究如何把接近人类语言的高级语言所编写的程序转换成机器指令了。这些研究成果都归属于“编译原理”领域,并且“编译原理”是计算机专业学生的必修课。
那么根据编译原理,C语言是怎么转换成汇编语言,总共分以下几个步骤:
1. 预处理 -> 2.词法分析 -> 3.语法分析 -> 4.语义分析 -> 5.优化 -> 6.链接
注意,我上面列出的过程是目前实际中真正采用的步骤,编译原理课程中可能没有把完整步骤列出来,只列举了核心的几个步骤。
上面每个步骤在编译原理课程中都有一个专门的章节来讲述。这里大概说一下每个步骤的作用吧。
1. 预处理:负责执行C语言中的#include, #if, #else 等预处理指令。注意,这里是去执行这些预处理指令。这些预处理指令的作用是根据你的系统环境配凑出最终版的源代码。