编译器基于编程语言的规则、目标机器的语言指令集和操作系统遵循的惯例,经过一系列过程生成机器代码。GCC C语言编译器以汇编代码形式产生输出,汇编代码是机器代码的文本表示,给出程序中的每一条指令。然后,GCC调用汇编器和链接器,根据汇编代码生成可执行的机器代码。在本章中我们近距离的观察机器代码,以及人类可读的表示——汇编语言。
现在我们只需要用高级语言来编程,比如C语言,JAVA语言,而不需要用机器语言,高级语言会屏蔽程序的细节,即程序级的实现,但是用高级语言所得到的编程结果和机器级语言得到的结果是一致的。并且高级语言相较于机器级语言,移植性更高,可以在很多不同的机器上编译和执行,而汇编代码则是与特定机器密切相关的。
那么,为什么我们还是需要学习机器代码,即使编译器承担了生成大量的汇编代码的大部分工作,但对于一个严谨的程序员来说,能够阅读和理解汇编代码仍是一项特别重要的技能。为什么说能够阅读和理解汇编代码是一项非常重要的技能?
- 能够理解编译器的优化能力,并分析代码中隐含的低效率
- 高级语言提供的抽象层会隐藏我们想要了解的程序的运行时行为,比如说了解线程是如何共享程序数据或保持数据私有的,以及准确知道如何在哪里访问数据。再比如说,程序遭受攻击的许多方式,都涉及程序存储运行时控制信息的方式的细节。许多攻击程序利用系统程序的漏洞重写信息,从而获得了系统的控制权。了解这些漏洞是如何出现的,以及如何防御它们,需要具备程序机器级表示的知识。
在本章中,我们要学习一种特别的汇编语言,了解如何将C程序编译成这种形式的机器代码。我们必须了解将C程序结构变换成机器代码时所做的转换。相对于C代码表示的计算操作,优化编译器能够重新排序执行顺序,消除不必要的计算 ,用快速操作替换慢速操作,甚至将递归计算变换成迭代计算。
首先,看一下Inter处理器的发展情况:
Inter处理器系列,俗称x86,经历了一个长期的,不断进化的发展过程。开始时,它是第一代单芯片、16位微处理器之一,由于当时集成电路技术水平十分有限,其中做了妥协。以后,它不断地成长,利用进步的技术满足更高性能和支持更高级操作系统的需求。
以下列举了一些Inter处理器的模型,以及它们的一些关键特性,特别是影响机器级编程得特性。我们用实现这些处理器所需要的晶体管数量来说明演变过程的复杂性。其中,“K”表示1 000,“M”表示1 000 000,而“G”表示1 000 000 000。
8086(1978年,29K个晶体管)。它是第一代单芯片、16位微处理器之一。
8088是8086的一个变种,在8086的基础上增加了一个8位外部总线,构成最初的IBM的个人计算机的心脏。IBM与当时还并不强大的微软签订了合约,开发MS-DOS操作系统。最初的机器型号只有32 768字节的内存和两个软存,没有硬件处理器。从体系结构上来说,这些机器只能655 360字节的地址空间——地址只有20位长(1 048 576字节),而操作系统保留了393 216字节自用。
1980年,Inter提出了8087浮点协处理器(45K个晶体管),它是与一个8086或8088处理器一同运行,执行浮点指令。8087建立了x86系列的浮点模型,通常被称为“x87”。
80286(1982年,134K个晶体管)。增加了更多的寻址模式(现在已经废弃了),构成了IBM PC-AT个人计算机的基础,这种计算机是MS Windows最初的平台。
i386(1985年,275K个晶体管)。将体系结构扩展到32位。增加了平坦寻址模式,Linux和最近的Windows操作系统都是使用这种模式。这是Intel中第一台全面支持Unix操作系统的机器。
i486(1989年,1.2M个晶体管)。改善了性能,同时将浮点单元集成到了处理器芯片,但是指令集没有明显的改变。
Pentium(1993年,3.1M个晶体管)。改善了性能,不过只对指令集进行了小的扩展。
PentiumPro(1995年,5.5M个晶体管)。引入了全新的处理器设计,在内部被称为P6微体系结构。指令集中增加了一类“条件传输”指令。
Pentium/MMX(1997年,4.5M个晶体管)。在Pentium处理器中增加了一类新的处理整数向量的指令。每个数据大小可以是1、2、4字节。每个向量总长64位。
Pentium II(1997年,7M个晶体管)。P6微体系结构的延伸。
Pentium III(1999年,8.2M个晶体管)。引入了SSE,这是一类处理整数或浮点数向量的指令。每个数据可以是1、2、4个字节,打包成128位的向量。由于芯片上包括了二级高速缓存,这种芯片后来的版本最多使用24M个晶体管。
Pentium 4(2000年,42M个晶体管)。SSE扩展到了SSE2,增加了新的数据类型(包括双精度浮点数),以及针对这些格式的144条新指令。有了这些扩展,编译器可以使用SSE指令(而不是x87指令),来编译浮点代码。
Pentium 4E(2004年,125M个晶体管)。增加了超线程。这种技术可以在一个处理器上同时运行两个程序;还增加了EM64T,它是Inter对AMD提出的对于IA32的64位扩展的实现,我们称之为x86-64。
Core 2(2006年,291M个晶体管)。回归到类似于P6的微体系结构。Inter的第一个多核微处理器,即多处理器实现在一个芯片上。但不支持超线程。
Core i7, Nehalem(2008年,781M个晶体管)。既支持超线程,又支持多核,最初的版本支持每个核上执行两个程序,每个芯片上最多四个核。
Core i7,Sandy Bridge(2011年,1,17G个晶体管)。引入了AVX,这是对SSE的扩展,支持把数据封装进256位的向量。
Core i7,Haswell(2013年,1.4G个晶体管)。将AVX扩展到了AVX2,增加了更多的指令和指令格式。
每个后继处理器的设计都是后向兼容的——较早的版本上编译的代码可以在较新的处理器上面运行。正如我们看到的,为了保持这种进化传统,指令集中有很多非常奇怪的东西。Inter处理器系列有好几个名字,包括IA32,也就是“Inter 32位体系结构”,以及最新的Inter64,即IA32的64位扩展,我们也称为x86-64。最常见的名字是“x86”,我们用它指代整个系列。
最初的8086提供的内存模型和它在80286中的扩展,到i386的时候就已经过时了。原来x87浮点指令在引入SSE2以后就过时了。