c++多态的原理

一.虚函数表

如上,sizeof(Base)在32位编译器上结果是多少呢?是4吗?答案是8!!!!

为什么?看监视:

可以看出,b中不只有_a成员,还有一个_vfptr放在对象的前面(注意,有些平台可能是放在最后面)。对象中的这个指针叫做虚函数表指针,指向一个虚函数表,表中存放的是虚函数的地址。

虚函数表简称虚表。

1.单继承关系中的虚表

那么基类和派生类中的虚表是怎么分配的呢?

我们以下面的继承关系为例进行讲解:

class Base
{
private:
	int _a=1;
public:
	virtual void func1()
	{
		cout << "Base->func1" << endl;
	}
	virtual void func2()
	{
		cout << "Base->func2" << endl;
	}
	void func3()
	{
		cout << "Base->func3" << endl;
	}
};
class Derive: public Base
{
private:
	int _b=1;
public:
	virtual void func1()
	{
		cout << "Derive->func1()" << endl;
	}
	virtual void func4()
	{
		cout << "Derive->func4()" << endl;
	}
};
int main()
{
	Derive d;
	Base b;
}

如上会发现,两个对象不是公用一张表,而是每个类都有一张表。Derive仅仅重写了Base的func1,所以两个类的func1是在不同的地址,但是derive没有重写base的func2,所以两张表上的func2都指向同一块空间!!!

那同一个类的对象是共用一个虚表还是每个对象单独有一个虚表?如下:

同类对象的虚表指针都指向同一块空间。

还有一件事情,上面derive类中一个虚函数func3,那为啥监视中没有看到func3的身影呢?难道func3不在虚表中吗?答案是否定的。func3也在虚表中,只不过监视窗口是经过优化的,不是最准确的,最准确的是内存窗口。下面我们通过虚表的打印来看一下到底一张虚表中有几个虚函数

打印虚表:

怎么打印虚表呢?首先要找到虚表的地址->通过虚表指针,虚表指针存在于一个对象的前四个字节(x86平台是前8个字节),怎么取到前四个字节呢?可以将对象取地址,并且强转为int*类型(注意,不能转为int,因为类型转换只能在同型间进行,也就是指针与指针),即:(int*)&b,然后对这个地址解引用才能走到虚表所在之处:*((int*)&b)这样就找到了虚表所在的位置,最后进行遍历即可。

typedef void (*VFUNC)();
void PrintVFPT(VFUNC a[])
{
	for (size_t i = 0; a[i] != 0; i++)
	{
		printf("[%d]:%p\n", i, a[i]);
	}
}
int main()
{
	Derive d1;
	Base b;
	printf("Derive->\n");
	PrintVFPT((VFUNC*)*((int*)&d1));
	printf("Base->\n");
	PrintVFPT((VFUNC*)*((int*)&b));
}

如上,其实虚表就是一个数组,一个函数指针数组,里面存放的是函数指针。所以我们先要对函数指针类型进行typedef,以方便使用。for循环中,打印的每一个元素都是一个地址。

为啥0是循环结束的条件??因为根据内存可知,每一个块内存结尾都是四个字节的00.

结果如下:

这样就可以看出,Derive的虚表中存了三个虚函数指针,所以func3也在虚表中。

下面这中打印方式会更加直观:

typedef void (*VFUNC)();
void PrintVFPT(VFUNC a[])
{
	for (size_t i = 0; a[i] != 0; i++)
	{
		VFUNC f = a[i];
		f();
	}
	printf("\n");
}

对象的内存结构:

如上图,这是Derive的,对象的最开始就是虚表和Base的成员,0x00959b64就是虚表的地址,紧接着就是父类对成员变量_a,最后就是成员变量_b。

总结:

1.派生类对象由两部分构成,一部分是父类继承下来的成员,另一部分就是自己的成员

2.基类对象和派生类对象的虚表不一样,每一个类都有一张共同的虚表

3.子类对象存储时,要先存储父类对成员,再存储自己的成员,但是继承父类成员时,不会将虚表也继承

2.多继承中的虚表

以如下继承关系为例

class A
{
public:
	virtual void func1()
	{
		cout << "A->func1" << endl;
	}
	virtual void func2()
	{
		cout << "A->func2" << endl;
	}
};
class B
{
public:
	virtual void func1()
	{
		cout << "B->func1" << endl;
	}
	virtual void func2()
	{
		cout << "B->func2" << endl;
	}
};
class C:public A,public B
{
public:
	virtual void func1()
	{
		cout << "C->func1" << endl;
	}
	virtual void func3()
	{
		cout << "C->func3()" << endl;
	}
};

对象的内存结构:

我们直接看C的内存结构:

如上,第一块是A的,第二块是继承的B的,最后一块才是自己的成员变量

如上这张图,也能证明,C在继承A和B的时候,并没有继承他们的虚表,而是有自己独立的虚表,并且由于继承了两个有虚函数的类,所以有两张虚表。

那么在打印C的虚表时,就不能简简单单使用上面单继承的方式去打印了

打印虚表:

由上面对内存结构分析可知,c有两张虚表,如何全部打印下来呢?

需要调用两次打印表的操作,打印第一个表的做法和单继承的一样,因为第一个表就在c对象的开头。那第二章表呢?

首先要偏移到第二张表的开头,大致思路就是c的地址加上a类的大小:&d+sizeof(A)。但是d是一个指针,对它加一不是向后一个字节,而是向后一个B对象的大小。所以还是得先进性类型转换,转成char*,如下:

typedef void (*VFUNC)();
void PrintVFPT(VFUNC a[])
{
	cout << "虚表地址>" << a << endl;
	for (size_t i = 0; a[i] != 0; i++)
	{
		VFUNC f = a[i];
		printf("[%d]:%p->", i, a[i]);
		f();
	}
	printf("\n");
}
int main()
{
	A a;
	B b;
	C c;
	printf("A->\n");
	PrintVFPT((VFUNC*)*((int*)&a));
	printf("B->\n");
	PrintVFPT((VFUNC*)*((int*)&b));
	printf("C->\n");
	VFUNC* vft1 = (VFUNC*)(*((int*)&c));
	PrintVFPT(vft1);
	VFUNC* vft2 = (VFUNC*)*((int*)((char*)&c + sizeof(A)));
	PrintVFPT(vft2);
}

我们将打印虚表的代码完善后,再看一下三个类的虚表:

如上,A和B类的需表中都是只有两个虚函数,并且都是自己的

对于c类,有两个虚表,其中第一个是与A类相关的虚表,func1是C重写的,所以c的func1与a的func1的地址不同,而c没有重写func2,所以c里面的func2就是a里面的func2,所以俩个的func2地址相同,然后func3是C类独有的虚函数,他被放在了c类的第一张虚表中

c的第二张虚表和第一张同理,C重写了b的func1,所以与b不同,而func2与b相同。


其实上面对第二张虚表的打印可以使用下面的巧妙方法:

使用切割,让ptr指针直接指向第二张虚表。


上面的虚表的打印让我们发现了一个问题

C类重写了A和B类的func1函数,并且只有一种实现方式,但是为什么这几张虚表中的func1函数的地址不同?

表中存放的地址不同,但是调用的时候却调用了同一个函数

这就得结合汇编代码来看了:

先看a的:

首先,这里call的是eax,而不是像普通调用一样call一个函数。进入:

再jmp:

就进入到了func1,它的首条指令地址为0x00B12870

再看b的:

同样,call了eax

再往下看:

他是先给ecx减8,再jmp:

再来:

最终到了func1,而且首条指令地址也是0x00B12870

有没有发现,b多跳了几次,最终都到了唯一的一个func中。很神奇

b在跳转到过程中有一步是对ecx减8。

ecx是干啥的?是调用成员函数,传递this指针的。为啥要减8?因为func1是c对象的成员函数,所以this指针应该是c的(因为可能会在函数中访问c的成员),然而b所处的位置是c对象的中间(前面是继承自A的),所以要剪掉a的大小,让指针指向c对象的开始。

而a对象正好在c的开头,所以不需要减

总之,sub ecx 8的作用就是修正this指针,指向C对象。这也是为啥函数地址一般不存首条至零点地址的原因,就是为了修正this指针或者获取this指针。

总结:

1.该类继承了几个有虚函数的父类,该类就有几张虚表

2.子类中没有被重写的虚函数放在第一张虚表中

二.多态的原理

由上述分析可知,多态的实现是依赖于虚函数表的。

父类对引用/指针指向哪类对象,就会去哪个类的虚函数表中找到函数地址,并进行调用。

普通调用与多态调用的区别

普通调用是在编译链接时确定地址

多态调用则是在运行时去虚表中找到函数地址,确定了地址再调用

相关面试题

1.静态成员可以是虚函数吗?

不可以,因为他没有this指针

2.inline函数可以是虚函数吗?

可以,不过,当是普通调用时,inline起作用,当是多态调用时,inline不起作用

3.构造函数可以是虚函数吗?

不可以,虚表是在编译时生成,但是对象的虚表指针则是在构造函数阶段初始化,所以在调用构造函数时,指针还没有初始化,没办法去虚表中找函数!!!!

4.析构函数什么场景下必须是虚函数

父类指针=new 子类对象;delete父类指针

5.对象访问普通函数快还是虚函数快?

当是普通调用时,一样快;当是多态调用时,普通函数快,因为虚函数还得去虚表中找地址

6.虚函数表在什么时候生成?存放在哪里?

在编译时就生成了,存放在代码段,如下:

会发现和常量区的很接近,也就是代码段。

虚函数和普通函数都是放在一起的,也放在代码段。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值