函数调用
需要程序栈的原因
程序中函数要相互调用,如何能保证函数A在调用函数B,B函数执行完后返回到A中继续执行剩下的代码?我们的解决方法是:在内存中开辟一段空间,用栈这个后进先出的数据结构,在程序调用函数之前,我们都把调用返回后的地址压栈。函数执行完后,就把压入的地址出栈,自然而然就能继续执行剩下的代码了。
实际的程序中,压栈的不只有函数调用完成后的返回地址。在函数A调用B的时候,需要传输一些参数,这些参数在数据寄存器不够用的时候也会被压入栈中。整个函数A所占用的所有的内存空间,就是函数A的栈帧。同时栈底(内存地址一开始固定)在最上面,栈顶在最下面。一层层压栈后,栈顶内存地址逐渐变小。
我们来看以上代码的执行流程:
-
在调用34行的call指令时,会把当前PC寄存器里的下一条指令的地址压栈,保留函数调结束后要执行的指令地址。
-
而add函数第0行,push rbp这个指令,就是在进行压栈。这里的rbp又叫栈帧指针,存放了当前栈帧位置的寄存器。push rbp就是把main函数的栈底地址,压入到main函数栈帧的栈顶。
-
接着执行 mov rbp rsp,意味把rsp的值赋值到rbp,就相当于让rbp指向rsp。rsp栈指针始终指向栈顶。这时候创建出了add的栈帧。
-
执行完函数add后,add栈帧销毁,然后执行12行pop rbp,rbp又指向了main函数的栈底。
-
执行13行,ret,同时把call调用的时候压入的PC寄存器里的下一条指令出栈,更新到PC寄存器中。
如何利用函数内联优化性能
如果递归层数过深,在栈空间里创建非常占内存的变量(比如一个巨大的数组),会给我们带来栈溢出(stack overfkow)。如何优化?
我们可以把一个实际调用的函数产生的指令,来替换对应的函数调用指令。前提是被调用的函数里,没有调用其他函数。我们通常把它叫做函数内联。