这章的知识点有:
1.函数的定义
2.函数的声明
3.作用域
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器
上一篇学习了1.函数的定义,实际上也使用到了2.函数的声明。上一篇示例代码如下:
#include
int a = 'a';
int b = 15;
int c = 17;
int f(int,int,int);
main(){
f(a,b,c);
}
int f(int a,int b,int c)
{
int x = a;
int y = b;
int z = c;
print("%d", x);
print("%d", y);
print("%d", z);
return x;
}
其中下面这一行就是函数f 的声明:
int f(int,int,int);
编译成汇编代码后,汇编代码中并没有体现函数声明的语句。也就是说,加不加这条函数声明,编译后的汇编代码没有区别。那声明语句被编译成什么了呢?这里先留个疑问,等后面学习了更多有关预处理和编译的知识后再来解答。
下面看第3个内容“作用域”:
3.作用域
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器
程序可以看成是变量定义和函数定义的集合。那么作用域指的也即变量与函数的作用域。变量又分为局部变量(也叫自动变量)和全局变量(也叫外部变量),它们的作用域也不相同。
局部变量的作用域:声明该变量的函数。
外部变量的作用域:从声明它的地方开始,到其所在的(待编译的)文件的末尾结束;
函数参数的作用域:可以看作局部变量,其作用域与局部变量相同;
函数本身的作用域:函数默认是外部的,其作用域与外部变量相同。
上一篇的示例代码中也使用了局部变量和外部变量以及函数和参数,可以从对上一篇示例代码编译后的汇编代码的分析中来理解它们的作用域。
上一篇的C语言示例代码本篇开头已贴出,再来看看对应的汇编代码:
.file "function.c"
.intel_syntax
.globl _a
.data /*.data通知as汇编后续语句,将它们追加在编号为0的数据段末。*/
.align 4
_a:
.long 97
.globl _b
.align 4
_b:
.long 15
.globl _c
.align 4
_c:
.long 17
.def ___main; .scl 2; .type 32; .endef
.text /*通知as把后续语句汇编到编号为0的子段。*/
.globl _main
.def _main; .scl 2; .type 32; .endef
_main:
push ebp
mov ebp, esp
sub esp, 24
and esp, -16
mov eax, 0
add eax, 15
add eax, 15
shr eax, 4
sal eax, 4
mov DWORD PTR [ebp-4], eax
mov eax, DWORD PTR [ebp-4]
call __alloca
call ___main
mov eax, DWORD PTR _c
mov DWORD PTR [esp+8], eax
mov eax, DWORD PTR _b
mov DWORD PTR [esp+4], eax
mov eax, DWORD PTR _a
mov DWORD PTR [esp], eax
call _f
leave
ret
.section .rdata,"dr"
LC0:
.ascii "%d\0"
.text /*通知as把后续语句汇编到编号为0的子段。*/
.globl _f
.def _f; .scl 2; .type 32; .endef
_f:
push ebp
mov ebp, esp
sub esp, 24
mov eax, DWORD PTR [ebp+8]
mov DWORD PTR [ebp-4], eax
mov eax, DWORD PTR [ebp+12]
mov DWORD PTR [ebp-8], eax
mov eax, DWORD PTR [ebp+16]
mov DWORD PTR [ebp-12], eax
mov eax, DWORD PTR [ebp-4]
mov DWORD PTR [esp+4], eax
mov DWORD PTR [esp], OFFSET FLAT:LC0
call _print
mov eax, DWORD PTR [ebp-8]
mov DWORD PTR [esp+4], eax
mov DWORD PTR [esp], OFFSET FLAT:LC0
call _print
mov eax, DWORD PTR [ebp-12]
mov DWORD PTR [esp+4], eax
mov DWORD PTR [esp], OFFSET FLAT:LC0
call _print
mov eax, DWORD PTR [ebp-4]
leave
ret
.def _print; .scl 2; .type 32; .endef
可以看到,代码的第4行“.data”指令,将后面几行中的a、b、c 三个外部变量存入了数据段内存中,它们在程序运行的整个过程中都是存在且可以访问的。
而在代码中的_main 函数和_f 函数之前都有“.text”指令,该指令将_main 函数和_f 函数的代码存入了另一个内存段中,它们也是随时可以访问的。
而函数的参数以及函数内部声明的局部变量x、y、z 在上面的代码中是没有姓名的,只有当程序执行到函数内对应的位置时,它们才以[esp+8]、[ebp-4] 这样的形式被分配内存,在函数执行期间,它们的值是存在且可以被访问的,参考上一篇中的表格2:
表格2
而当函数执行结束并返回后,表格2中的esp、ebp 的值也被释放,变成了函数调用前的值,所以在表格2这段内存栈中存放的局部变量x、y、z 的值也无法再被访问。
以上就是对作用域的相关分析,下面继续向下学习。
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器
4.头文件内容可能很多,放到下一篇,接下来看5.静态变量和6.寄存器变量。示例代码:
#include
static char buf[100];
main(){
static int bufp = 7;
register int x = 3;
x = x + 1;
printf("%d", x);
}
这段代码定义了一个外部静态变量buf ,一个局部静态变量bufp 和一个寄存器变量x ,编译后的汇编代码如下:
.file "function.c"
.intel_syntax
.def ___main; .scl 2; .type 32; .endef
.data
.align 4
bufp.0:
.long 7
.section .rdata,"dr"
LC0:
.ascii "%d\0"
.text
.globl _main
.def _main; .scl 2; .type 32; .endef
_main:
push ebp
mov ebp, esp
sub esp, 24
and esp, -16
mov eax, 0
add eax, 15
add eax, 15
shr eax, 4
sal eax, 4
mov DWORD PTR [ebp-4], eax
mov eax, DWORD PTR [ebp-4]
call __alloca
call ___main
mov eax, 3
inc eax
mov DWORD PTR [esp+4], eax
mov DWORD PTR [esp], OFFSET FLAT:LC0
call _printf
leave
ret
.lcomm _buf,112
.def _printf; .scl 2; .type 32; .endef
两段代码相关语句对比:
static char buf[100];
static int bufp = 7;
register int x = 3;
bufp.0:
.long 7
_main:
mov eax, 3
ret
.lcomm _buf,112 /*为一个本地通用符号symbol预留length个字节的内存。因为symbol没有被声明为全局性的符号,所以symbol对ld通常不可见。*/
.def _printf; .scl 2; .type 32; .endef
可以看到,外部静态变量buf 没有了.globl 描述符,所以作用域仅在当前文件。
而定义在main 函数内部的局部变量bufp ,也拥有了姓名,其值在程序运行期间一直存在,但只能被定义它的函数使用。
寄存器变量x 确实存在了寄存器eax 中,而不是像之前一样存入栈内存中。
也可以用static 来声明函数,函数默认是外部的,用static 声明后变为静态的,作用域仅在当前文件中。
了解了静态变量和函数与非静态之间的区别后,继续学习下面的内容。
4.头文件
7.程序块结构
8.初始化
9.递归
10.C预处理器
由于7.程序块结构只是一些概念,8.初始化前面的代码中也有涉及,不再举例。下面来看9.递归的示例代码:
#include
int f(int);
main(){
f(10);
}
int f(int x){
x--;
if(x > 0){
printf("%d\n", x);
f(x);
}
}
编译后的汇编关键代码:
_main:
mov DWORD PTR [esp], 10
call _f
leave
ret
.section .rdata,"dr"
LC0:
.ascii "%d\12\0"
_f:
push ebp
mov ebp, esp
sub esp, 8
dec DWORD PTR [ebp+8]
cmp DWORD PTR [ebp+8], 0
jle L3
mov eax, DWORD PTR [ebp+8]
mov DWORD PTR [esp+4], eax
mov DWORD PTR [esp], OFFSET FLAT:LC0
call _printf
mov eax, DWORD PTR [ebp+8]
mov DWORD PTR [esp], eax
call _f
L3:
leave
ret
可见,递归在汇编中即在子函数中调用自身,结合上一篇的分析以及表格2可以得出,每调用一次函数自身,栈空间都会向上拓展一段(本例中是8个内存单元,指令“sub esp,8”),用来存放本次函数运行需要用到的参数及局部变量的值;每返回一次,相应的释放一段栈内存空间(表格2中栈指针寄存器esp 向下移动),直到整个递归结束。
其实,递归的过程与上一篇分析的在函数_main 中调用函数_f 并返回的过程没什么不同,只是调用的函数由其它函数变成了自身而已。
好了,这次先学到这里,还剩下头文件和预处理器两个内容,一起留到下一篇。