函数调用的几个概念：_stdcall,_cdecl....

最新推荐文章于 2023-01-17 17:07:34 发布

chm_study

最新推荐文章于 2023-01-17 17:07:34 发布

阅读量382

点赞数

文章标签： input pascal winapi callback 汇编 string

1、_stdcall是Pascal程序的缺省调用方式，通常用于Win32 Api中，函数采用从右到左的压栈方式，自己在退出时清空堆栈。VC将函数编译后会在函数名前面加上下划线前缀，在函数名后加上"@"和参数的字节数。

2、C调用约定（即用__cdecl关键字说明）按从右至左的顺序压参数入栈，由调用者把参数弹出栈。对于传送参数的内存栈是由调用者来维护的（正因为如此，实现可变参数的函数只能使用该调用约定）。另外，在函数名修饰约定方面也有所不同。

_cdecl是C和C＋＋程序的缺省调用方式。每一个调用它的函数都包含清空堆栈的代码，所以产生的可执行文件大小会比调用_stdcall函数的大。函数采用从右到左的压栈方式。VC将函数编译后会在函数名前面加上下划线前缀。是MFC缺省调用约定。

3、__fastcall调用约定是“人”如其名，它的主要特点就是快，因为它是通过寄存器来传送参数的（实际上，它用ECX和EDX传送前两个双字（DWORD）或更小的参数，剩下的参数仍旧自右向左压栈传送，被调用的函数在返回前清理传送参数的内存栈），在函数名修饰约定方面，它和前两者均不同。

_fastcall方式的函数采用寄存器传递参数，VC将函数编译后会在函数名前面加上"@"前缀，在函数名后加上"@"和参数的字节数。

4、thiscall仅仅应用于“C++”成员函数。this指针存放于CX寄存器，参数从右到左压。thiscall不是关键词，因此不能被程序员指定。

5、naked call采用1-4的调用约定时，如果必要的话，进入函数时编译器会产生代码来保存ESI，EDI，EBX，EBP寄存器，退出函数时则产生代码恢复这些寄存器的内容。naked call不产生这样的代码。naked call不是类型修饰符，故必须和_declspec共同使用。

关键字 __cdecl和__fastcall可以直接加在要输出的函数前，也可以在编译环境的Setting.../C/C++ /Code Generation项选择。当加在输出函数前的关键字与编译环境中的选择不同时，直接加在输出函数前的关键字有效。它们对应的命令行参数分别为/Gz、 /Gd和/Gr。缺省状态为/Gd，即__cdecl。

要完全模仿PASCAL调用约定首先必须使用__stdcall调用约定，至于函数名修饰约定，可以通过其它方法模仿。还有一个值得一提的是WINAPI 宏，Windows.h支持该宏，它可以将出函数翻译成适当的调用约定，在WIN32中，它被定义为__stdcall。使用WINAPI宏可以创建自己的APIs。

2)名字修饰约定

1、修饰名(Decoration name)

“C” 或者“C++”函数在内部（编译和链接）通过修饰名识别。修饰名是编译器在编译函数定义或者原型时生成的字符串。有些情况下使用函数的修饰名是必要的，如在模块定义文件里头指定输出“C++”重载函数、构造函数、析构函数，又如在汇编代码里调用“C””或“C++”函数等。

修饰名由函数名、类名、调用约定、返回类型、参数等共同决定。

2、名字修饰约定随调用约定和编译种类(C或C++)的不同而变化。函数名修饰约定随编译种类和调用约定的不同而不同，下面分别说明。

a、C编译时函数名修饰约定规则：

__stdcall调用约定在输出函数名前加上一个下划线前缀，后面加上一个“@”符号和其参数的字节数，格式为_functionname@number 。

__cdecl调用约定仅在输出函数名前加上一个下划线前缀，格式为_functionname。

__fastcall调用约定在输出函数名前加上一个“@”符号，后面也是一个“@”符号和其参数的字节数，格式为@functionname@number。

它们均不改变输出函数名中的字符大小写，这和PASCAL调用约定不同，PASCAL约定输出的函数名无任何修饰且全部大写。

b、C++编译时函数名修饰约定规则：

__stdcall调用约定：
          1、以“?”标识函数名的开始，后跟函数名；
          2、函数名后面以“@@YG ”标识参数表的开始，后跟参数表；
          3、参数表以代号表示：
             X--void ，
             D--char，
             E--unsigned char，
             F--short，
             H--int，
             I--unsigned int，
             J--long，
             K--unsigned long，
             M--float，
             N--double，
             _N--bool，
             ....
             PA--表示指针，后面的代号表明指针类型，如果相同类型的指针连续出现，以“0”代替，一个“0”代表一次重复；
          4、参数表的第一项为该函数的返回值类型，其后依次为参数的数据类型,指针标识在其所指数据类型前；
          5、参数表后以“@Z ”标识整个名字的结束，如果该函数无参数，则以“Z”标识结束。

    其格式为“?functionname@@YG*****@Z ”或“?functionname@@YG*XZ ”，例如
          int Test1（char *var1,unsigned long）-----“?Test1@@YGHPADK@Z ”
          void Test2（）                       -----“?Test2@@YGXXZ ”

__cdecl调用约定：
规则同上面的_stdcall调用约定，只是参数表的开始标识由上面的“@@YG ”变为“@@YA ”。

__fastcall调用约定：
规则同上面的_stdcall调用约定，只是参数表的开始标识由上面的“@@YG ”变为“@@YI ”。

VC++对函数的省缺声明是"__cedcl",将只能被C/C++调用.

CB在输出函数声明时使用4种修饰符号
//__cdecl
cb的默认值，它会在输出函数名前加_，并保留此函数名不变，参数按照从右到左的顺序依次传递给栈，也可以写成_cdecl和cdecl形式。
//__fastcall
她修饰的函数的参数将尽肯呢感地使用寄存器来处理，其函数名前加@，参数按照从左到右的顺序压栈；
//__pascal
它说明的函数名使用Pascal格式的命名约定。这时函数名全部大写。参数按照从左到右的顺序压栈；
//__stdcall

在TURBO C中用修饰符cdecl说明的函数或不加说明的函数按照从右向左的顺序将参数压入堆栈，即给定调用函数（a，b，c）后，a最先进栈，然后是b和c。
在进行函数调用时，有几种调用方法，分为C式，Pascal式。在C和C++中C式调用是缺省的，除非特殊声明。二者是有区别的，下面我们用实例说明一下：

1. __cdecl :C和C++缺省调用方式
例子：
void Input( int &m,int &n);/*相当于void __cdecl Input(int &m,int &n);*/
   以下是相应的汇编代码：
   00401068   lea         eax,[ebp-8] ;取[ebp-8]地址(ebp-8),存到eax
   0040106B   push        eax         ;然后压栈
   0040106C   lea         ecx,[ebp-4] ;取[ebp-4]地址(ebp-4),存到ecx
   0040106F   push        ecx         ;然后压栈
   00401070   call        @ILT+5(Input) (0040100a);然后调用Input函数
   00401075   add         esp,8       ;恢复栈

从以上调用Input函数的过程可以看出：在调用此函数之前，首先压栈ebp-8,然后压栈ebp-4,然后调用函数Input,最后Input函数调用结束后，利用esp+8恢复栈。由此可见，在C语言调用中默认的函数修饰_cdecl，由主调用函数进行参数压栈并且恢复堆栈。
下面看一下：地址ebp-8和ebp-4是什么？
在VC的VIEW下选debug windows,然后选Registers,显示寄存器变量值，然后在选debug windows下面的Memory,输入ebp-8的值和ebp-4的值(或直接输入ebp-8和-4)，看一下这两个地址实际存储的是什么值，实际上是变量 n 的地址(ebp-8),m的地址(ebp-4),由此可以看出：在主调用函数中进行实参的压栈并且顺序是从右到左。另外，由于实参是相应的变量的引用，也证明实际上引用传递的是变量的地址(类似指针)。
总结：在C或C++语言调用中默认的函数修饰_cdecl，由主调用函数进行参数压栈并且恢复堆栈，实参的压栈顺序是从右到左，最后由主调函数进行堆栈恢复。由于主调用函数管理堆栈，所以可以实现变参函数。另外，命名修饰方法是在函数前加一个下划线(_).

2. WINAPI (实际上就是PASCAL，CALLBACK,_stdcall)
例子：
void WINAPI Input( int &m,int &n);
看一下相应调用的汇编代码：
00401068   lea         eax,[ebp-8]
0040106B   push        eax
0040106C   lea         ecx,[ebp-4]
0040106F   push        ecx
00401070   call        @ILT+5(Input) (0040100a)
    从以上调用Input函数的过程可以看出：在调用此函数之前，首先压栈ebp-8,然后压栈ebp-4,然后调用函数Input,在调用函数Input之后，没有相应的堆栈恢复工作(为其它的函数调用，所以我没有列出)
    下面再列出Input函数本身的汇编代码：(实际此函数不大，但做汇编例子还是大了些，大家可以只看前和后，中间代码与此例子无关)

39: void WINAPI Input( int &m,int &n)
40:   {
00401110   push        ebp
00401111   mov         ebp,esp
00401113   sub         esp,48h
00401116   push        ebx
00401117   push        esi
00401118   push        edi
00401119   lea         edi,[ebp-48h]
0040111C   mov         ecx,12h
00401121   mov         eax,0CCCCCCCCh
00401126   rep stos    dword ptr [edi]
41:       int s,i;
42:
43:       while(1)
00401128   mov         eax,1
0040112D   test        eax,eax
0040112F   je          Input+0C1h (004011d1)
44:       {
45:       printf("/nPlease input the first number m:");
00401135   push        offset string "/nPlease input the first number m"... (004260b8)
0040113A   call        printf (00401530)
0040113F   add         esp,4
46:       scanf("%d",&m);
00401142   mov         ecx,dword ptr [ebp+8]
00401145   push        ecx
00401146   push        offset string "%d" (004260b4)
0040114B   call        scanf (004015f0)
00401150   add         esp,8
47:
48:       if ( m<1 ) continue;
00401153   mov         edx,dword ptr [ebp+8]
00401156   cmp         dword ptr [edx],1
00401159   jge         Input+4Dh (0040115d)
0040115B   jmp         Input+18h (00401128)
49:       printf("/nPlease input the first number n:");
0040115D   push        offset string "/nPlease input the first number n"... (0042608c)
00401162   call        printf (00401530)
00401167   add         esp,4
50:       scanf("%d",&n);
0040116A   mov         eax,dword ptr [ebp+0Ch]
0040116D   push        eax
0040116E   push        offset string "%d" (004260b4)
00401173   call        scanf (004015f0)
00401178   add         esp,8
51:
52:       if ( n<1 ) continue;
0040117B   mov         ecx,dword ptr [ebp+0Ch]
0040117E   cmp         dword ptr [ecx],1
00401181   jge         Input+75h (00401185)
00401183   jmp         Input+18h (00401128)
53:
54:       for(i=1,s=0;i<=n;i++)
00401185   mov         dword ptr [ebp-8],1
0040118C   mov         dword ptr [ebp-4],0
00401193   jmp         Input+8Eh (0040119e)
00401195   mov         edx,dword ptr [ebp-8]
00401198   add         edx,1
0040119B   mov         dword ptr [ebp-8],edx
0040119E   mov         eax,dword ptr [ebp+0Ch]
004011A1   mov         ecx,dword ptr [ebp-8]
004011A4   cmp         ecx,dword ptr [eax]
004011A6   jg          Input+0A3h (004011b3)
55:           s=s+i;
004011A8   mov         edx,dword ptr [ebp-4]
004011AB   add         edx,dword ptr [ebp-8]
004011AE   mov         dword ptr [ebp-4],edx
004011B1   jmp         Input+85h (00401195)
56:       if ( m >= s )
004011B3   mov         eax,dword ptr [ebp+8]
004011B6   mov         ecx,dword ptr [eax]
004011B8   cmp         ecx,dword ptr [ebp-4]
004011BB   jl          Input+0AFh (004011bf)
57:           break;
004011BD   jmp         Input+0C1h (004011d1)
58:       else
59:           printf(" m < n*(n+1)/2,Please input again!/n");
004011BF   push        offset string " m < n*(n+1)/2,Please input agai"... (00426060)
004011C4   call        printf (00401530)
004011C9   add         esp,4
60:       }
004011CC   jmp         Input+18h (00401128)
61:
62:   }
004011D1   pop         edi
004011D2   pop         esi
004011D3   pop         ebx
004011D4   add         esp,48h
004011D7   cmp         ebp,esp
004011D9   call        __chkesp (004015b0)
004011DE   mov         esp,ebp
004011E0   pop         ebp
004011E1   ret         8
最后，我们看到在函数末尾部分，有ret 8，明显是恢复堆栈，由于在32位C++中，变量地址为4个字节(int也为4个字节)，所以弹栈两个地址即8个字节。
由此可以看出：在主调用函数中负责压栈，在被调用函数中负责恢复堆栈。因此不能实现变参函数，因为被调函数不能事先知道弹栈数量，但在主调函数中是可以做到的，因为参数数量由主调函数确定。
下面再看一下，ebp-8和ebp-4这两个地址实际存储的是什么值，ebp-8地址存储的是n 的值，ebp -4存储的是m的值。说明也是从右到左压栈,进行参数传递。

   总结：在主调用函数中负责压栈，在被调用函数中负责弹出堆栈中的参数，并且负责恢复堆栈。因此不能实现变参函数，参数传递是从右到左。另外，命名修饰方法是在函数前加一个下划线(_)，在函数名后有符号(@)，在@后面紧跟参数列表中的参数所占字节数(10进制)，如：void Input(int &m,int &n),被修饰成：_Input@8
   对于大多数api函数以及窗口消息处理函数皆用 CALLBACK ,所以调用前，主调函数会先压栈，然后api函数自己恢复堆栈。

   如：
      push edx
      push edi
      push eax
      push ebx
      call getdlgitemtexta
   你可以想一下，这几个寄存器中存的都是什么？

下面是一份总结：

针对于C/C++用户，最常用的两个调用约定是_cdecl和_stdcall（也就是WINAPI，CALLBACK，PASCAL）,他们在如下方面不同：

1. 默认支持：VC默认使用_cdecl。所以如果需要使用_stdcall，可采用两种方法：（1）可以在函数名前手工添加，只对单一函数有效（2）直接修改工程属性（C/C++ > Advanced > Calling Convention）来一次性配置所有的函数
2. 功能不同：_cdecl可实现变长参数列表
3. 代码大小：_stdcall更小
4. 速度不同：_cdecl更快（代码更多当然意味着运行更快，有点像内联函数）

5. 谁负责恢复堆栈：
   _cdecl主调用函数进行参数压栈并且恢复堆栈；
   _stdcall主调用函数进行参数压栈，被调函数恢复堆栈；
   这也正是产生
   1. 不同代码大小的原因：如果使用_cdecl的函数多次调用同一函数，就要产生多份恢复码。
   2. 功能不同的原因：实现变长参数列表。一份恢复码只能将一种长度的参数表出栈，所以要对不同长度的参数表堆栈恢复，必须要有多份代码，所以变长参数必须有主调函数恢复（所以是_cdecl）。

6. 产生的函数名不同：具体见上面讨论（注意这与C++产生修饰名不同）
7. 使用范围：
   _stdcall：通常用于DLL的创建（以支持多语言调用）；此外Win32 API函数皆用_stdcall（比如MessageBox），所以Win32程序中的自定义函数也做好使用_stdcall。
   _cdecl：非DLL的console程序。