C++虚函数是构成多态的一部分,多态指的是运行期决定调用哪个函数,下面是个纯虚函数例子:
#include "stdafx.h"
class Test{
public:
Test(){
printf("Test::Test\n");
}
virtual ~Test(){
printf("Virtual ~Test()\n");
}
virtual void prointer()=0;
virtual void pointf()=0;
};
class TestA:public Test{
public:
TestA(){
printf("TestA::TestA\n");
}
virtual ~TestA(){
printf("TestA::TestA\n");
}
virtual void prointer(){
printf("Derive Class TestA::Pointer\n");
}
virtual void pointf(){
printf("Derive Class TestA::Pointf\n");
}
};
int _tmain(int argc, _TCHAR* argv[]){
TestA *pTest=new TestA;
pTest->pointf();
pTest->prointer();
delete pTest;
return 0;
}
这段代码定义了一个抽象类,和一个派生类,抽象类不能创建自己的对象,但是可以间接的从派生类创建自己的对象,构成纯虚函数的条件:
1. 一个类中必须要有一个虚函数
2. 在虚函数后面添加一个=0就是一个纯虚函数了
抽象基类的所有纯虚函数必须被派生类定义的虚函数覆盖,否者派生类也是一个抽象基类,不能创建自己的对象;先看下Test类,由于Test类不能创建自己的对象,所以我根据TestA类来解析调用过程。Test类我们可以把它看做一个地址,这个地址里面有些指针,只想函数的地址,假如Test类的地址是0x401000,那么在这个地址里面的第一个就是虚折构函数,方便释放类的对象的时候调用,第二个没有了,因为我们只在Test类中定义一个析构函数,和一个构造函数,构造函数在编译的时候就被编译器从类的里面给趴到Main来了,看下反汇编代码:
00401091 |. 6A 04 PUSH 4
00401093 |. E8 68000000 CALL <JMP.&MSVCR90.operator new>
00401098 |. 8BF0 MOV ESI,EAX
0040109A |. 83C4 04 ADD ESP,4
0040109D |. 85F6 TEST ESI,ESI
0040109F |. 74 27 JE SHORT 004010C8
这里就是TestA *pTest=new TestA这里了,从这段代码我们可以看出,new是无论何如都会调用成功的,因为CALL <JMP.&MSVCR90.operator new>后的返回值,被比较是否等于0了,虽然这个比较不是我们的代码,但是编译器就已经够定了new无论如何都会调用成功,如果CALL <JMP.&MSVCR90.operator new>的返回值是0,那么构造函数都会被跳过,而构造函数是会被程序调用的,如果不调用的话,这样就和C++构造函数的说法相反了,所以new 操作符分配的内存一定会成功的,我们在接着看下下面这段代码:
004010A1 |. 57 PUSH EDI
004010A2 |. 8B3D B0204000 MOV EDI,DWORD PTR DS:[<&MSVCR90.printf>] ; msvcr90.printf
004010A8 |. 68 0C214000 PUSH 0040210C ; /format = "Test::Test"
004010AD |. C706 7C214000 MOV DWORD PTR DS:[ESI],0040217C ; |
004010B3 |. FFD7 CALL EDI ; \printf
004010B5 |. 68 2C214000 PUSH 0040212C ; ASCII "TestA::TestA"
004010BA |. C706 8C214000 MOV DWORD PTR DS:[ESI],0040218C
004010C0 |. FFD7 CALL EDI
这段代码显然是两个类的构造函数被调用了,那么其中传递了两个地址给ESI,我们看下这个地址是什么类容,我们跟随到数据窗口看一下,显示格式选择为地址格式
0040217C 00401000 这就是这个地址的内容,一个代码地址
C++构造.00401000其中第一个地址指向如下地址,跟随一下
00401000 . 56 PUSH ESI
00401001 . 8BF1 MOV ESI,ECX
00401003 . 68 18214000 PUSH 00402118 ; /format = "Virtual ~Test()"
00401008 . C706 7C214000 MOV DWORD PTR DS:[ESI],0040217C ; |
0040100E . FF15 B0204000 CALL DWORD PTR DS:[<&MSVCR90.printf>] ; \printf
这里显然就是折够函数了,所以当一个类中有虚析构函数的时候,这个虚析构函数的地址会被放在类指针的最前面,这里把Test的地址的指针放入ESI里面,然后根据ESP+8来判断是否调用delete操作符,这些都是编译器自动添加的,这是编译器的事,我还没那技术去研究
00401014 . 83C4 04 ADD ESP,4
00401017 . F64424 08 01 TEST BYTE PTR SS:[ESP+8],1
0040101C . 74 09 JE SHORT 00401027
0040101E . 56 PUSH ESI
0040101F . E8 D6000000 CALL <JMP.&MSVCR90.operator delete>
00401024 . 83C4 04 ADD ESP,4
00401027 > 8BC6 MOV EAX,ESI
00401029 . 5E POP ESI
0040102A . C2 0400 RETN 4
继续我们上面的构造函数,类的构造函数被一次从上至下的调用之后,传递了Test和TestA的地址到ESI里面,我们声明的是TestA的对象,所以最后一个地址就是TestA了,看下反汇编代码的调用过程
004010C2 |. 83C4 08 ADD ESP,8
004010C5 |. 5F POP EDI
004010C6 |. EB 02 JMP SHORT 004010CA
004010C8 |> 33F6 XOR ESI,ESI
004010CA |> 8B06 MOV EAX,DWORD PTR DS:[ESI] ;
004010CC |. 8B50 08 MOV EDX,DWORD PTR DS:[EAX+8]
004010CF |. 8BCE MOV ECX,ESI
004010D1 |. FFD2 CALL EDX
这里ESI指向TestA类的起始地址,把这个起始地址传到EAX里面之后,就把这个类里面的一个函数地址放到EDX里面,TestA类本身一共有4个函数,刚才构造函数被外部也就是Main调用了,那么里面只剩下3个地址了,我们知道一个类如果有虚析构函数,第一个地址就指向虚析构函数的地址,EAX+8就是调用了
pTest->pointf();至于为什么,自己想一下,MOV ECX,ESI通过ECX来保证堆栈的平衡
004010D3 |. 8B06 MOV EAX,DWORD PTR DS:[ESI] ; C++构造.0040218C
004010D5 |. 8B50 04 MOV EDX,DWORD PTR DS:[EAX+4]
004010D8 |. 8BCE MOV ECX,ESI
004010DA |. FFD2 CALL EDX
这里就调用了pTest->prointer();因为我们是根据类的地址来决定调用哪个函数的
004010DC |. 8B06 MOV EAX,DWORD PTR DS:[ESI]
004010DE |. 8B10 MOV EDX,DWORD PTR DS:[EAX] ; C++构造.00401050
004010E0 |. 6A 01 PUSH 1
004010E2 |. 8BCE MOV ECX,ESI
004010E4 |. FFD2 CALL EDX
这里就是调用TestA类的虚折构函数,也就是当前类的地址的第一个指针,我们跟踪进去看一下,下面是反汇编代码:
00401050 . 56 PUSH ESI
00401051 . 57 PUSH EDI
00401052 . 8B3D B0204000 MOV EDI,DWORD PTR DS:[<&MSVCR90.printf>] ; msvcr90.printf
00401058 . 8BF1 MOV ESI,ECX
0040105A . 68 2C214000 PUSH 0040212C ; /format = "TestA::TestA"
0040105F . C706 8C214000 MOV DWORD PTR DS:[ESI],0040218C ; |
00401065 . FFD7 CALL EDI ; \printf
00401067 . 68 18214000 PUSH 00402118 ; ASCII "Virtual ~Test()"
0040106C . C706 7C214000 MOV DWORD PTR DS:[ESI],0040217C
00401072 . FFD7 CALL EDI
00401074 . 83C4 08 ADD ESP,8
00401077 . F64424 0C 01 TEST BYTE PTR SS:[ESP+C],1
0040107C . 74 09 JE SHORT 00401087
0040107E . 56 PUSH ESI
0040107F . E8 76000000 CALL <JMP.&MSVCR90.operator delete>
00401084 . 83C4 04 ADD ESP,4
00401087 > 5F POP EDI
00401088 . 8BC6 MOV EAX,ESI
0040108A . 5E POP ESI
0040108B . C2 0400 RETN 4
这里调用了两个虚析构函数的地方,为什么是先调用~TestA,而不是先调用~Test呢,因为我们把这两个析构函数定义为了虚函数,虚函数是在运行期决定调用谁的,当我们把TestA的成员函数调用完毕之后,析构函数会自动调用,因此,TestA完了之后就调用自己的析构函数,释放最新分配的内存,所以,先调用TestA的折构函数,再调用Test的折构函数,这也是为什么把析构函数声明为虚函数的原因,
这里调用了两个虚析构函数之后,就是用delete指针删除了由new分配的地址,分析完毕。
总结一下:
当我们定义了一个带有虚函数的类的时候,这个类的虚函数就会被放在一个地址表里面,这个地址表被放在类的入口里面,当我们调用哪个类的时候,就使用哪个类的入口来调用里面的虚函数,这就证名明了C++中得函数同名的虚函数的多态机制。
讲得不好,如果有错误的地方请各位指出来,谢谢!
转载于:https://blog.51cto.com/charley/654826