调用规范与可变参数表
作者:阿半
关键字 | 堆栈清理者 | 参数传递顺序 |
__cdecl | 调用者 | 从右至左 |
__stdcall | 被调用者 | 从右至左 |
__fastcall | 被调用者 | 从右至左,前两个参数由寄存器ecx,edx传递 |
thiscall | 被调用者或者调用者 | 从右至左 |
__cdecl 最大好处在于由于是调用者清理栈,它可以处理可变参数,缺点则在于它增加了程序的大小,因为在每个调用返回的时候,需要多执行一条清理栈的指令。
__stdcall 是在windows程序设计中出现的最多的调用规则,所有的不可变参数的API调用都使用这个规则。
__fastcall 在windows内核设计中被广泛的使用,由于两个参数由寄存器直接传递,采用这种规则的函数效率要比以上两种规则高。
thiscall是C++成员函数的默认调用规范,编译期间,这种调用会根据函数是否支持可变参数表来决定采用什么方式清理堆栈。如果成员函数不支持可变参数,那么它就是用参数入栈,ecx保存this指针的方式进行调用,如果成员函数支持可变参数,那么它的调用和__cdecl类似,唯一不同的是将this指针最后压入栈中进行传递。
调用者和被调用者必须采用同样的规则才能保证程序的正常执行,曾经看到很多程序员犯的错误就是由于调用规范的不一样,致使程序异常,比如:
DWORD ThreadFunc(LPVOID lpParam) { //… } CreateThread(..,(LPTHREAD_START_ROUTINE)ThreadFunc, …);
如果在编译期间没有指定编译选项/Gz(指定未指明调用规范的函数采用__stdcall方式),那么编译器自动将ThreadFunc处理成__cdecl调用规范(/Gd),这样可能在线程开始的时候正常执行,然而退出的时候由于堆栈没有正常清理,造成访问违例或者非法指令错误。
以上说了很多清理栈的问题,那么为什么清理栈很重要呢。堆栈是线程相关的,也就是说每一个线程含有一个堆栈,这个堆栈上保存了局部变量,调用返回地址等很多线程相关的数据,这也是为什么独立运行的线程可以调用同样一个函数而互不干扰的原因。堆栈的特点恐怕大家已经非常熟悉了,那么根据上面的每一种调用,我给出一个简单的图示来说明清理堆栈的重要性,以及为什么上面的例子代码会出错。
图一 这是线程堆栈在运行的时候的样子
调用前和后esp的差值中间包含了函数参数表,返回地址这样的重要信息,举个简单的调用例子.假设有某个函数定义是这样的:
Int __cdecl func(void* p);
再假设esp调用函数前的数值为0x1234,那么在进入这个函数体内看到的堆栈是这样的:
122C 1230 1234 Next p
这里的next指调用函数后的下一条指令的位置。调用函数的汇编码:
Push p Call func Add esp,4 《--注意这里,由于是cdecl调用,需要调用者清栈。
而一个__stdcall调用的汇编码:
Push p Call func
这里没有了add esp,4这个指令,因为在func函数返回的时候自己将esp已经复原了。再来看刚才举的错误的例子,由于强制转换的作用,线程开始函数被设置成了stdcall调用,而实际的线程函数被编译后,并没有执行堆栈的清理工作,线程函数返回的时候,由于堆栈的不正确,当然会发生错误。修改这个bug的方法只要在线程函数的定义前把__cdecl改成_stdcall即可。
有了上面的例子做基础来理解可变参数表就简单的多了,由于各种调用规范的限定,致使只有__cdecl调用规范可以采用可变参数表。先来看看可变参数表的定义(可以参考sdk目录下src/crt/varargs.h):
typedef char *va_list; #define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) ) #define va_dcl va_list va_alist; #define va_start(ap) ap = (va_list)&va_alist #define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define va_end(ap) ap = (va_list)0
va_list居然被定义成char* ?没错,这实际是用来定义了一个指针,指针的sizeof()就是操作系统可访问的地址空间的大小,也就是CPU相关的字长。_INTSIZEOF宏很简单,就是用来将数据以n的数据大小对齐。va_start宏有点模糊,可是如果你看懂了上面的堆栈数据结构,那么显然它就是获得最后一个固定参数的地址,也就是堆栈上的地址,va_arg先使得ap指向下一个参数,然后取得当前参数的值(注意,这个值正是堆栈上的值),va_end使得取参数过程结束。
这几个宏完成的动作很简单了,实际就是取得可变参数表在堆栈上的起始位置,然后根据参数类型,依次从堆栈上取出每一个参数。
本文简单的介绍了微软C/C++支持的调用类型,结合实例描述了规范的实际应用,最后根据CRT提供的源代码分析了可变参数表的实现。