在x64下函数调用的前4个参数总是放在寄存器中传递,剩余的参数则压入堆栈中。而x86上则是全部压入堆栈中(除了fastcall方式)。这4个用于存放参数的寄存器分别是:存放整数参数的RCX,RDX,R8,R9;存放浮点数参数的XMM0,XMM1,XMM2,XMM3。
按照所传参数是整数还是浮点数的不同,寄存器的使用规则如下:
全部整数参数:
func1(int a, int b, int c, int d, int e);
参数a放入RCX,参数b放入RDC,参数c放入R8,参数d放入R9,参数e么压栈。 参数传递规则:按照参数表声明的顺序,从左向右,前4个参数依次放入RCX,RDX,R8,R9中。
全部浮点数参数:
func1(float a, float b, float c, double d, float e);
a放入XMM0,b放入XMM1,c放入XMM2,d放入XMM3,e压栈
参数传递规则:按照参数声明的顺序,从左向右,前4个参数依次放入XMM0,XMM1,XMM2,XMM3中
整数和浮点数参数混合出现:
func3(float a, int b, double c, int d)
a放入XMM0中,b放入RDX,c放入XMM2,d放入R9。
这里比较特殊,其实就是按照这个规则:
a b c d
RDX R9
XMM0 XMM2
也就是说4个整数寄存器严格的一一对应前4个参数,同样前4个XMM寄存器严格的一一应前4个参数,如果是整数浮点数间隔出现,那么就保持对应关系,选择对应的寄存器即可。
指针参数:
指针的传递遵循整数参数传递方式。
结构体参数:
结构体特殊一点,按照ddk的描述,如果结构体长度小于64bit,则使用整数参数的传递规则。但如果是一个很大的结构体,那么应该还是要在堆栈中申请临时空间的(但ddk没有明说这一点,参考x86的规则应该如此)。
未声明函数的调用:
ddk里特别列举了这样一个例子:
func1();
func2(){
func1(2, 1.0, 7)
}
在这种情况下,func1()的参数表其实不明确,那么参数的传递要怎样进行?这里采用了一个比较保守的规则,就是:整数参数还是按照寄存器映射关系放入对应的寄存器中,浮点数在按照映射关系放入XMM寄存器后,还需要按照整数参数的寄存器映射关系放入整数寄存器中一次,这就是为啥我说是“比较保守的规则”。就现在这个例子而言,结果如下:
2在RCX中,1.0在RDX和XMM1中,7在R8中。
|
版权为 win_hate 所有, 转载请保留作者名字 我这段时间要把以前的一个 x86_32 的 linux 程序移植到 x86_64(AMD) 的 linux 环境里. 由于写的是数学算法, 64 与 32 位有很大不同, 代码实际上要重写. 看了点资料后, 觉得 AMD64 的扩展于以前 16 到 32 位的扩展很类似, e**, 扩展为 r**, 此外还多了8个通用寄存器 r8~r15.指令格式与32位的极为相似. 我觉得比较容易, 所以没再仔细看, 就开始动手写了. 我的程序由若干个汇编模块于与若干个c模块构成, 很多c模块要调用汇编模块. 作为试验, 我先写了个简单的汇编函数, 然后用c来调用. 结果算出来的值始终是错误的. 这令我很恼火, 因为函数很简单, 没有多少出错的余地. 后来我把程序反汇编出来, 错误马上浮现出来了, 函数的参数居然是通过寄存器来传递的. 我凭以前的经验, 从堆栈里取参数, 算出的结果当然不对了. 我以前不是没碰到过用寄存器传递参数的情况, 但所在的环境都不是 pc. 在 x86_32/linux 中, 即使用 -O3 优化选项, gcc 仍通过栈来传递参数的. 所以我们现在知道, 在 x86_64/linux/gcc3.2 中, 即使不打开优化选项, 函数的参数也会通过寄存器来传递, 这肯定是阔了的表现(通用寄存器多了). 我试验了多个参数的情况,发现一般规则为, 当参数少于7个时, 参数从左到右放入寄存器: rdi, rsi, rdx, rcx, r8, r9。当参数为 7 个以上时, 前 6 个与前面一样, 但后面的依次从 "右向左" 放入栈中。 例如: (1) 参数个数少于7个: g (a, b) 有趣的是, 实际上将参数放入寄存器的语句是从右到左处理参数表的, 这点与32位的时候一致. CODE 2) 参数个数大于 7 个的时候 教训: 补充: 环境为 AMD Athlon64, Mandrak linux 9.2, GCC3.3.1 |