[wtl学习]－[第一天]-[转]C++中虚函数工作原理

最新推荐文章于 2022-08-04 18:54:43 发布

Hakunamatata1984

最新推荐文章于 2022-08-04 18:54:43 发布

阅读量1.2k

点赞数 1

分类专栏： wtl

wtl 专栏收录该内容

3 篇文章

订阅专栏

本文深入探讨了C++中虚函数的工作原理，包括虚函数表（VTABLE）和虚函数指针（VPTR）的概念。并通过示例代码详细解释了它们如何支持运行时多态，同时对比了不同多态实现机制的优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言：最近用BCB6做了个程序，程序开发过程发现相关参考资料实在少之又少。有鉴于谷哥被墙，想上国外网站查找资料十次能有八次无法打开网站。做完这个程序后还是决定放弃BCB6了。同样是C＋＋技术可BCB能找到的资料实在太少。思路完全被局限。一个远程获取JSON数据解析的功能差点把我折腾死。
目前来看换用VC＋WTL是很好的选择。从头学起又让我学到了不少知识。以前觉得自己大牛。学着学着感觉我就不懂C＋＋。

看了ATL Internals: Working with ATL 8, Second Edition By Christopher Tavares, Kirk Fertitta, Brent Rector, Chris Sells中关于窗口一章后发现基类中大量使用了ATL_NO_VTABLE。想要明白为什么要使用这个宏，先得了解C＋＋中虚函数工作原理。

学习第一天：

「转」C++中虚函数工作原理
原文出处：http://blog.csdn.net/hackbuteer1/article/details/7883531

一、虚函数的工作原理
      虚函数的实现要求对象携带额外的信息，这些信息用于在运行时确定该对象应该调用哪一个虚函数。典型情况下，这一信息具有一种被称为 vptr（virtual table pointer，虚函数表指针）的指针的形式。vptr 指向一个被称为 vtbl（virtual table，虚函数表）的函数指针数组，每一个包含虚函数的类都关联到 vtbl。当一个对象调用了虚函数，实际的被调用函数通过下面的步骤确定：找到对象的 vptr 指向的 vtbl，然后在 vtbl 中寻找合适的函数指针。
      虚拟函数的地址翻译取决于对象的内存地址，而不取决于数据类型(编译器对函数调用的合法性检查取决于数据类型)。如果类定义了虚函数，该类及其派生类就要生成一张虚拟函数表，即vtable。而在类的对象地址空间中存储一个该虚表的入口，占4个字节，这个入口地址是在构造对象时由编译器写入的。所以，由于对象的内存空间包含了虚表入口，编译器能够由这个入口找到恰当的虚函数，这个函数的地址不再由数据类型决定了。故对于一个父类的对象指针，调用虚拟函数，如果给他赋父类对象的指针，那么他就调用父类中的函数，如果给他赋子类对象的指针，他就调用子类中的函数(取决于对象的内存地址)。
      虚函数需要注意的大概就是这些个地方了，之前在More effective C++上好像也有见过，不过这次在Visual C++权威剖析这本书中有了更直白的认识，这本书名字很牛逼，看看内容也就那么回事，感觉名不副实，不过说起来也是有其独到之处的，否则也没必要出这种书了。
      每当创建一个包含有虚函数的类或从包含有虚函数的类派生一个类时，编译器就会为这个类创建一个虚函数表（VTABLE）保存该类所有虚函数的地址，其实这个VTABLE的作用就是保存自己类中所有虚函数的地址，可以把VTABLE形象地看成一个函数指针数组，这个数组的每个元素存放的就是虚函数的地址。在每个带有虚函数的类中，编译器秘密地置入一指针，称为v p o i n t e r（缩写为V P T R），指向这个对象的V TA B L E。当构造该派生类对象时，其成员VPTR被初始化指向该派生类的VTABLE。所以可以认为VTABLE是该类的所有对象共有的，在定义该类时被初始化；而VPTR则是每个类对象都有独立一份的，且在该类对象被构造时被初始化。
      通过基类指针做虚函数调用时（也就是做多态调用时），编译器静态地插入取得这个V P T R，并在V TA B L E表中查找函数地址的代码，这样就能调用正确的函数使晚捆绑发生。为每个类设置V TA B L E、初始化V P T R、为虚函数调用插入代码，所有这些都是自动发生的，所以我们不必担心这些。

#include<iostream>
using namespace std;

class A
{
public:
	virtual void fun1()
	{
		cout << "A::fun1()" << endl;
	}
	virtual void fun2()
	{
		cout << "A::fun2()" << endl;
	}
};

class B : public A
{
public:
	void fun1()
	{
		cout << "B::fun1()" << endl;
	}
	void fun2()
	{
		cout << "B::fun2()" << endl;
	}
};

int main()
{
	A *pa = new B;
	pa->fun1();
	delete pa;

	system("pause"); 
	return 0;
}

毫无疑问，调用了B::fun1()，但是B::fun1()不是像普通函数那样直接找到函数地址而执行的。真正的执行方式是：首先取出pa指针所指向的对象的vptr的值，这个值就是vtbl的地址，由于调用的函数B::fun1()是第一个虚函数，所以取出vtbl第一个表项里的值，这个值就是B::fun1()的地址了，最后调用这个函数。因此只要vptr不同，指向的vtbl就不同，而不同的vtbl里装着对应类的虚函数地址，所以这样虚函数就可以完成它的任务，多态就是这样实现的。
      而对于class A和class B来说，他们的vptr指针存放在何处？其实这个指针就放在他们各自的实例对象里。由于class A和class B都没有数据成员，所以他们的实例对象里就只有一个vptr指针。
      虚拟函数使用的缺点
　　优点讲了一大堆，现在谈一下缺点，虚函数最主要的缺点是执行效率较低，看一看虚拟函数引发的多态性的实现过程，你就能体会到其中的原因，另外就是由于要携带额外的信息（VPTR），所以导致类多占的内存空间也会比较大，对象也是一样的。
     含有虚函数的对象在内存中的结构如下:

class A
{
private:
	int a;
	int b;
public:
	virtual void fun0()
	{
		cout<<"A::fun0"<<endl;
	}
};

1、直接继承
那我们来看看编译器是怎么建立VPTR指向的这个虚函数表的，先看下面两个类：

class base
{
private:
	int a;
public:
	void bfun()
	{
	}
	virtual void vfun1()
	{
	}
	virtual void vfun2()
	{
	}
};

class derived : public base
{
private:
	int b;
public:
	void dfun()
	{
	}
	virtual void vfun1()
	{
	}
	virtual void vfun3()
	{
	}
};

两个类的VPTR指向的虚函数表（VTABLE）分别如下：
base类
——————
VPTR——>    |&base::vfun1 |
                      ——————
|&base::vfun2 |
——————

derived类
———————
VPTR——>    |&derived::vfun1 |
———————
|&base::vfun2     |
———————
|&derived::vfun3 |
———————
       每当创建一个包含有虚函数的类或从包含有虚函数的类派生一个类时，编译器就为这个类创建一个VTABLE，如上图所示。在这个表中，编译器放置了在这个类中或在它的基类中所有已声明为virtual的函数的地址。如果在这个派生类中没有对在基类中声明为virtual的函数进行重新定义，编译器就使用基类的这个虚函数地址。（在derived的VTABLE中，vfun2的入口就是这种情况。）然后编译器在这个类中放置VPTR。当使用简单继承时，对于每个对象只有一个VPTR。VPTR必须被初始化为指向相应的VTABLE，这在构造函数中发生。
       一旦VPTR被初始化为指向相应的VTABLE，对象就"知道"它自己是什么类型。但只有当虚函数被调用时这种自我认知才有用。
       没有虚函数类对象的大小正好是数据成员的大小，包含有一个或者多个虚函数的类对象编译器向里面插入了一个VPTR指针(void *)，指向一个存放函数地址的表就是我们上面说的VTABLE，这些都是编译器为我们做的我完全可以不关心这些。所以有虚函数的类对象的大小是数据成员的大小加上一个VPTR指针(void *)的大小。

总结一下VPTR 和 VTABLE 和类对象的关系:
       每一个具有虚函数的类都有一个虚函数表VTABLE，里面按在类中声明的虚函数的顺序存放着虚函数的地址，这个虚函数表VTABLE是这个类的所以对象所共有的，也就是说无论用户声明了多少个类对象，但是这个VTABLE虚函数表只有一个。
       在每个具有虚函数的类的对象里面都有一个VPTR虚函数指针，这个指针指向VTABLE的首地址，每个类的对象都有这么一种指针。

两种多态实现机制及其优缺点
除了c++的这种多态的实现机制之外，还有另外一种实现机制，也是查表，不过是按名称查表，是smalltalk等语言的实现机制。这两种方法的优缺点如下：
（1）、按照绝对位置查表，这种方法由于编译阶段已经做好了索引和表项(如上面的call *(pa->vptr[1]） )，所以运行速度比较快；缺点是：当A的virtual成员比较多（比如1000个），而B重写的成员比较少（比如2个），这种时候，B的vtableＢ的剩下的998个表项都是放Ａ中的ｖｉｒｔｕａｌ成员函数的指针，如果这个派生体系比较大的时候，就浪费了很多的空间。
比如：ＧＵＩ库，以ＭＦＣ库为例，ＭＦＣ有很多类，都是一个继承体系；而且很多时候每个类只是１，２个成员函数需要在派生类重写，如果用Ｃ＋＋的虚函数机制，每个类有一个虚表，每个表里面有大量的重复，就会造成空间利用率不高。于是ＭＦＣ的消息映射机制不用虚函数，而用第二种方法来实现多态，那就是：
（２）、按照函数名称查表，这种方案可以避免如上的问题；但是由于要比较名称，有时候要遍历所有的继承结构，时间效率性能不是很高。（关于ＭＦＣ的消息映射的实现，看下一篇文章）
３、总结：
如果继承体系的基类的virtual成员不多，而且在派生类要重写的部分占了其中的大多数时候，用Ｃ＋＋的虚函数机制是比较好的；
但是如果继承体系的基类的virtual成员很多，或者是继承体系比较庞大的时候，而且派生类中需要重写的部分比较少，那就用名称查找表，这样效率会高一些，很多的ＧＵＩ库都是这样的，比如ＭＦＣ，ＱＴ。
ＰＳ：其实，自从计算机出现之后，时间和空间就成了永恒的主题，因为两者在98%的情况下都无法协调，此长彼消；这个就是计算机科学中的根本瓶颈之所在。软件科学和算法的发展，就看能不能突破这对时空权衡了。呵呵。。
何止计算机科学如此，整个宇宙又何尝不是如此呢？最基本的宇宙之谜，还是时间和空间。

C++如何不用虚函数实现多态
可以考虑使用函数指针来实现多态

#include<iostream>
using namespace std;

typedef void (*fVoid)();

class A
{
public:
	static void test()
	{
		printf("hello A\n");
	}

	fVoid print;

	A()
	{
		print = A::test;
	}
};

class B : public A
{
public:
	static void test()
	{
		printf("hello B\n");
	}

	B()
	{
		print = B::test;
	}
};


int main(void)
{
	A aa;
	aa.print();

	B b;
	A* a = &b;
	a->print();

	return 0;
}

这样做的好处主要是绕过了vtable。我们都知道虚函数表有时候会带来一些性能损失。