这个周末,我手工写了一个 _alloca ,试着替换 CRT 的实现(莫追究原因 :) )。一开始老不得要领,总是不能正常工作。
gcc 的这个 _alloca 是个内部函数,其调用协议不同于 alloca 。它的尺寸参数并不通过堆栈传递,而是直接通过寄存器。在 X86 上,就是 eax 。
返回值当然是通过 eax 送出,同时一并修改了堆栈寄存器 esp 。
经过多次程序崩溃,并用 gdb 对汇编代码逐行分析,还看出了另外一点门道。
调用 _alloca 这个函数前,调用者并不需要对其它寄存器里的数据安全负责。就是说,_alloca 需要负责除 eax esp 之外的寄存器内的数据安全,不得破坏。(或许没有这么严格,我试着用了一个 ecx ,并没有出错。但是破坏掉 edx 却是一定会引起程序崩溃的)
如果打开 gcc 的优化开关(我使用的 -O2 ,gcc 版本 3.4.5),编译器有时候会预测 _alloca 的行为,并以此来决定堆栈上局部变量的分布(往往出现在代码中以常量申请固定尺寸的大数组的情况下)。_alloca 的行为被认为是在堆栈上准确分配经过 4 字节对齐后的 eax 内值大小的空间。不仅不能少分配,连多分配也是不允许的(否则会导致编译器生成的代码出错)。
最后给出云风的 _alloca 的实现。
.globl __alloca;
__alloca:
subl $1,%eax
andl $0xfffffffc,%eax /* align to dword */
subl %eax,%esp
pushl (%esp,%eax) /* return addr */
movl %esp,%eax
addl $4,%eax
ret
ps. 这个帖子放在这里,日后肯定会有同学偷懒搜代码搜过来的,嘿嘿。程序随便用,但出了问题别找我。我不帮人做作业。