让我们还是从熟悉的加减乘除等算术运算入手。图1.23给出了一个简单的C程序,其中包含了常见的C语言算术运算,我们依旧采取对比C语言代码和UCC编译器生成的汇编代码的方法来讨论。
图1.23 arith.c
我们有意在图1.23的第1至4行定义了几个初始化或未初始化的变量。图1.24给出了这几个变量在汇编代码中的区别。在图1.24中,第7行至第9行对应的是初始化为10的全局变量a;而第11至13行对应的是初始化为20的全局变量b;第15行对应的是没有作初始化的全局变量c;而第16行对应的是没有作初始化的静态变量d,为避免重名,被UCC编译器改名为”d.0”;而第17行对应的是初始化为5的静态变量e,被UCC编译器重命名为”e.1”,而且我们注意到汇编代码中不存在”.global e.1”,但是可在第7和第11行看到对变量a和b的global声明,这代表变量名a,b是在全局可见的,但e.1是静态的,只在当前文件中可见。按照C语言的语义,全局或静态未初始化的变量其缺省值一般为0。在生成目标文件(后缀为.obj或.o的文件)时,我们只需要在目标模块中记录这块要被初始化为0的空间有多大就可以,没有必要把一堆的0存到目标文件中。确切地说,汇编代码中第15行的”.comm”用于声明未初始化的全局变量,comm是common之意,代表这是一块公共用地,即全局变量之意,而第16行的”.lcomm”则用于声明未初始化的静态变量,lcomm是local common之意,只在本目标模块中可见。
图1.24 初始化和未初始化
接下来,让我们看一下图1.23的第5至第17行各C语言算术运算所对应的汇编代码,如下图1.25所示。图1.25中的第32至33行对应“c = a | b;”, 第32行把a的值从内存加载到寄存器eax中,第33行把内存中的变量b和寄存器eax作按位或运算,结果仍存于eax中,第34行再把运算结果从寄存器eax写回到内存中的变量c中。图1.25第35至49行所做的运算依次为andl,shll,sarl, addl和 subl。其中的and,add和sub对应按位与、加和减运算。而shl是Shift Left的缩写,进行左