C++虚函数表解析 (Lawliet 修改+注释版)(附有部分网友的重要评论)

C++ 虚函数表解析
 
2008-11-14 作者:陈皓 来源:csdn
 
 

前言


         C++中的 虚函数的作用主要是实现了多态的机制。关于 多态,简而言之就是用 父类型的指针指向其子类的实例,然后 通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓 泛型技术,说白了就是试图使用不变的代码来实现可变的算法
(有评论建议修改为: 所谓泛型技术,说白了就是试图 使用不变的接口实现可变的算法 ")。比如: 模板技术,RTTI技术,虚函数技术,要么是试图做到在 编译时决议,要么试图做到 运行时决议

关于虚函数的使用方法,我在这里不做过多的阐述。大家可以看看相关的C++的书籍。在这篇文章中,我只想从虚函数的实现机制上面为大家 一个清晰的剖析。


当然,相同的文章在网上也出现过一些了,但我总感觉这些文章不是很容易阅读,大段大段的代码,没有图片,没有详细的说明,没有比较,没有举一反三。不利于学习和阅读,所以这是我想写下这篇文章的原因。也希望大家多给我提意见。


言归正传,让我们一起进入虚函数的世界。



虚函数表


对C++了解的人都应该知道虚函数(Virtual Function)是通过一张虚函数表(Virtual Table)来实现的。简称为V-Table。在这个表中,主要是一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其容真实反应实际的函数。这样,在有虚函数的类的实例中这个表被分配在了这个实例的内存中(有评论建议修改为:一个类的虚函数表是静态的,也就是说对这个类的每个实例,他的虚函数表的是固定的不会为每个实例生成一个相应的虚函数表,而且虚函数表不是放在实例的内存),所以,当我们用父类的指针来操作一个子类的时候,这张虚函数表就显得由为重要了,它就像一个地图一样,指明了实际所应该调用的函数。


这里我们着重看一下这张虚函数表。C++的编译器应该是保证虚函数表的指针存在于对象实例中最前面的位置(这是为了保证取到虚函数表的有最高的性能——如果有多层继承或是多重继承的情况下)。 这意味着我们通过对象实例的地址得到这张虚函数表,然后就可以遍历其中函数指针,并调用相应的函数。(从这句话来看的话,有可能真的是为对象实例分配虚函数表,因为对象实例才有地址,类是没有实际地址的,所以上面以及以后的评论建议都要稍加注意,并不一定都是正确的,大家自己琢磨琢磨



    听我扯了那么多,我可以感觉出来你现在可能比以前更加晕头转向了。 没关系,下面就是实际的例子,相信聪明的你一看就明白了。

    假设我们有这样的一个类:


以下是引用片段:
class Base { 
     public: 
            virtual void f() { cout << "Base::f" << endl; } 
            virtual void g() { cout << "Base::g" << endl; } 
            virtual void h() { cout << "Base::h" << endl; } 
  
}; 
 

按照上面的说法,我们可以通过Base的实例得到虚函数表。 下面是实际例程:


以下是引用片段:

  typedef void(*Fun)(void);         // 这里是声明函数指针
  
            Base b; 
  
            Fun pFun = NULL;         // 创建函数指针pFun,初始化为NULL
  
            cout << "虚函数表地址:" << (int*)(&b) << endl;           // 评论建议修改为:(int*)(&b)是虚函数表指针的地址,也是实例b的地址,(int*)*(int*)(&b)才是
虚函数表的地址

            cout << "虚函数表 — 第一个函数地址:" << (int*)*(int*)(&b) << endl;   // 评论建议修改为:这是虚函数表的地址,同时也是第一个函数的地址。
   
            pFun = (Fun)*((int*)*(int*)(&b));      // 函数指针pFun指向虚函数表第一个函数的地址,指针的类型要匹配,所以强制转换
            pFun();                   //  执行虚函数表第一个函数

实际运行经果如下:(Windows XP+VS2003, Linux 2.6.22 + GCC 4.1.3)


以下是引用片段:

虚函数表地址:0012FED4 
虚函数表 — 第一个函数地址:0044F148 
Base::f

通过这个示例,我们可以看到,我们可以通过强行把&b转成int *取得虚函数表的地址(虚函数表指针的地址?),然后,再次取址就可以得到第一个虚函数的地址了,也就是Base::f(),这在上面的程序中得到了验证(把int* 强制转成了函数指针)。通过这个示例,我们就可以知道如果要调用Base::g()和Base::h(),其代码如下:


以下是引用片段:

             (Fun)*((int*)*(int*)(&b)+0);  // Base::f()             // 评论疑惑:这样子好像不可以调用函数,这里(Fun*)(...)只是一个函数指针
            (Fun)*((int*)*(int*)(&b)+1);  // Base::g() 
            (Fun)*((int*)*(int*)(&b)+2);  // Base::h()


这个时候你应该懂了吧。什么?还是有点晕。也是,这样的代码看着太乱了。没问题,让我画个图解释一下。如下所示:

注意:在上面这个图中,我在虚函数表的最后多加了一个结点,这是虚函数表的结束结点,就像字符串的结束符“\0”一样,其标志了虚函数表的结束。这个结束标志的值在不同的编译器下是不同的。在WinXP+VS2003下,这个值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,这个值是如果1,表示还有下一个虚函数表,如果值是0,表示是最后一个虚函数表。


下面,我将分别说明“无覆盖”和“有覆盖”时的虚函数表的样子。没有覆盖父类的虚函数是毫无意义的。我之所以要讲述没有覆盖的情况,主要目的是为了给一个对比。在比较之下,我们可以更加清楚地知道其内部的具体实现。




1.一般继承(无虚函数覆盖)


下面,再让我们来看看继承时的虚函数表是什么样的。假设有如下所示的一个继承关系:

请注意,在这个继承关系中,子类没有重载任何父类的函数。那么,在派生类的实例中,其虚函数表如下所示:

对于实例:Derive d; 的虚函数表如下:


我们可以看到下面几点:

1)虚函数按照其声明顺序放于表中。

2)父类的虚函数在子类的虚函数前面

我相信聪明的你一定可以参考前面的那个程序,来编写一段程序来验证。



2.一般继承(有虚函数覆盖)


覆盖父类的虚函数是很显然的事情,不然,虚函数就变得毫无意义。下面,我们来看一下,如果子类中有虚函数重载了父类的虚函数,会是一个什么样子?假设,我们有下面这样的一个继承关系。


为了让大家看到被继承过后的效果,在这个类的设计中,我只覆盖了父类的一个函数:f()。那么,对于派生类的实例,其虚函数表会是下面的一个样子:


我们从表中可以看到下面几点,

1)覆盖的f()函数被放到了虚表中原来父类虚函数的位置

2)没有被覆盖的函数依旧。


这样,我们就可以看到对于下面这样的程序,

以下是引用片段:
 Base *b = new Derive();                
          b->f();

  // 用 多态的实质 解释 的话,这里的意思是:用 父类的指针 b  指向子类的实例 new Drive() ,然后用 父类的指针 b 调用子类的函数fn()

由b所指的内存中的虚函数表的f()的位置已经被Derive::f()函数地址所取代,于是在实际调用发生时,是Derive::f()被调用了。这就实现了多态。



3.多重继承(无虚函数覆盖)


下面,再让我们来看看多重继承中的情况,假设有下面这样一个类的继承关系。注意:子类并没有覆盖父类的函数。


对于子类实例中的虚函数表,是下面这个样子:


我们可以看到:

1) 每个父类都有自己的虚表

2) 子类的成员函数被放到了第一个父类的表中。(所谓的第一个父类是按照声明顺序来判断的)

这样做就是为了解决不同的父类类型的指针指向同一个子类实例,而能够调用到实际的函数




4.多重继承(有虚函数覆盖)


下面我们再来看看,如果发生虚函数覆盖的情况。

下图中,我们在子类中覆盖了父类的f()函数。


下面是对于子类实例中的虚函数表的图:


我们可以看见,三个父类虚函数表中的f()的位置被替换成了子类的函数指针。这样,我们就可以任一静态类型的父类来指向子类,并调用子类的f()了。如:

以下是引用片段:
            Derive d; 

            Base1 *b1 = &d; 
            Base2 *b2 = &d; 
            Base3 *b3 = &d; 
            b1->f(); //Derive::f() 
            b2->f(); //Derive::f() 
            b3->f(); //Derive::f() 
  
            b1->g(); //Base1::g() 
            b2->g(); //Base2::g() 
            b3->g(); //Base3::g()




安全性


每次写C++的文章,总免不了要批判一下C++。这篇文章也不例外。通过上面的讲述,相信我们对虚函数表有一个比较细致的了解了。水可载舟,亦可覆舟。下面,让我们来看看我们可以用虚函数表来干点什么坏事吧。


一、通过父类型的指针访问子类自己的虚函数


我们知道,子类没有重载父类的虚函数是一件毫无意义的事情。因为多态也是要基于函数重载的。虽然在上面的图中我们可以看到Base1的虚表中有Derive的虚函数,但我们根本不可能使用下面的语句来调用子类的自有虚函数:

以下是引用片段:
  Base1 *b1 = new Derive(); 
            b1->f1();  //编译出错

任何妄图使用父类指针想调用子类中的未覆盖父类的成员函数的行为都会被编译器视为非法,所以,这样的程序根本无法编译通过。但在运行时,我们可以通过指针的方式访问虚函数表来达到违反C++语义的行为。(关于这方面的尝试,通过阅读后面附录的代码,相信你可以做到这一点)


二、访问non-public的虚函数


另外,如果父类的虚函数是private或是protected的,但这些非public的虚函数同样会存在于虚函数表中,所以,我们同样可以使用访问虚函数表的方式来访问这些non-public的虚函数,这是很容易做到的。

如:

以下是引用片段:
class Base { 
    private: 
            virtual void f() { cout << "Base::f" << endl; } 
  
}; 
  
class Derive : public Base{ 
  
}; 
  
typedef void(*Fun)(void); 
  
void main() { 
    Derive d; 
    Fun  pFun = (Fun)*((int*)*(int*)(&d)+0); 
    pFun(); 

 


结束语


C++这门语言是一门Magic的语言,对于程序员来说,我们似乎永远摸不清楚这门语言背着我们在干了什么。需要熟悉这门语言,我们就必需要了解C++里面的那些东西,需要去了解C++中那些危险的东西。不然,这是一种搬起石头砸自己脚的编程语言。

在文章束之前还是介绍一下自己吧。我从事软件研发有十个年头了,目前是软件开发技术主管,技术方面,主攻Unix/C/C++,比较喜欢网络上的技术,比如分布式计算,网格计算,P2P,Ajax等一切和互联网相关的东西。管理方面比较擅长于团队建设,技术趋势分析,项目管理。欢迎大家和我交流,我的MSN和Email是:haoel@hotmail.com


附录一:VC中查看虚函数表


我们可以在VC的IDE环境中的Debug状态下展开类的实例就可以看到虚函数表了(并不是很完整的)

   


附录 二:例程


下面是一个关于多重继承的虚函数表访问的例程:

以下是引用片段:
#include <iostream> 
using namespace std; 
  
class Base1 { 
public: 
            virtual void f() { cout << "Base1::f" << endl; } 
            virtual void g() { cout << "Base1::g" << endl; } 
            virtual void h() { cout << "Base1::h" << endl; } 
  
}; 
  
class Base2 { 
public: 
            virtual void f() { cout << "Base2::f" << endl; } 
            virtual void g() { cout << "Base2::g" << endl; } 
            virtual void h() { cout << "Base2::h" << endl; } 
}; 
  
class Base3 { 
public: 
            virtual void f() { cout << "Base3::f" << endl; } 
            virtual void g() { cout << "Base3::g" << endl; } 
            virtual void h() { cout << "Base3::h" << endl; } 
}; 
  
  
class Derive : public Base1, public Base2, public Base3 { 
public: 
            virtual void f() { cout << "Derive::f" << endl; } 
            virtual void g1() { cout << "Derive::g1" << endl; } 
}; 
  
  
typedef void(*Fun)(void); 
  
int main()  

            Fun pFun = NULL; 
  
            Derive d; 
            int** pVtab = (int**)&d;    //  二级指针pVtab用来动态申请二位数组
  
            //Base1's vtable 
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+0); 
            pFun = (Fun)pVtab[0][0]; 
            pFun(); 
  
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+1); 
            pFun = (Fun)pVtab[0][1]; 
            pFun(); 
  
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+2); 
            pFun = (Fun)pVtab[0][2]; 
            pFun(); 
  
            //Derive's vtable 
            //pFun = (Fun)*((int*)*(int*)((int*)&d+0)+3); 
            pFun = (Fun)pVtab[0][3]; 
            pFun(); 
  
            //The tail of the vtable 
            pFun = (Fun)pVtab[0][4]; 
            cout<<pFun<<endl;          // 
(Fun)pVtab[0][4]虚函数表的结束结点,就像字符串的结束符“\0”一样,其标志了虚函数表的结束。这个结束标志的值在不同的编译器下是不同的。在WinXP+VS2003下,这个值是NULL,所以输出的是00000000。
  
  
            //Base2's vtable 
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0); 
            pFun = (Fun)pVtab[1][0]; 
            pFun(); 
  
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1); 
            pFun = (Fun)pVtab[1][1]; 
            pFun(); 
  
            pFun = (Fun)pVtab[1][2]; 
            pFun();  
  
            //The tail of the vtable 
            pFun = (Fun)pVtab[1][3]; 
            cout<<pFun<<endl; 
  
  
  
            //Base3's vtable 
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0); 
            pFun = (Fun)pVtab[2][0]; 
            pFun(); 
  
            //pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1); 
            pFun = (Fun)pVtab[2][1]; 
            pFun(); 
  
            pFun = (Fun)pVtab[2][2]; 
            pFun();  
  
            //The tail of the vtable 
            pFun = (Fun)pVtab[2][3]; 
            cout<<pFun<<endl; 
  
            return 0; 
}
运行结果:


                                                                            

Feedback

写的很好!
------------------
"所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法"

可以修改成 "所谓泛型技术,说白了就是试图使用不变的 接口 来实现可变的算法", 这样更具有设计概念.
   回复    更多评论

#  re: C++虚函数表解析(转) 2009-03-25 23:35  江湖飘
在有虚函数的类的实例中这个表被分配在了 这个实例的内存中
这句话要更正一下:
一个类的虚函数表是静态的,也就是说对这个类的每个实例,他的虚函数表的是固定的,不会为每个实例生成一个相应的虚函数表。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-05-04 15:09  猪头三
@江湖飘
我试了一下,用两个实例,用楼主的方法取得虚函数表的地址,返回的地址不一样,请问是什么原因呢?   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-05-14 13:46  王平
小标题“一般继承(无虚函数覆盖)”下面的重载改为重写较为合适,分别对应于英文的override和overload,重载就是所谓的名同而签名不同,重写就是对子类对虚函数的重新实现。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-05-14 14:41  王平
这篇文章图文并茂,使用一种深入浅出的方式阐述了c++虚函数表的机制,同时还对这种方式的弊端做出了总结,实在是一篇不可多得的文章。
但是,不难发现,在文章中还是能够发现一些较为明显的错误,这个上面的评论者已经提出,在此就不赘述。
虽然这篇文章存在错误,但是瑕不掩瑜,楼主只要稍作修改,此篇文章便可堪称一绝,况楼主在此过程中还能够学到新的东西,望楼主再接再厉,多听听读者的意见。   回复    更多评论

#  re: C++虚函数表解析(转)[未登录] 2009-05-30 16:18  sky
问一个问题,(int*)(&b) 得到的是虚拟函数表的位置么?怎么感觉是指向虚拟函数表的指针的位置呢? *(int*)(&b) 才是虚拟函数表的位置吧?   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-06-12 16:53  zhangwh
非静态成员函数的调用都需要绑定一个对象指针(this),
请问:
pFun = (Fun)*((int*)*(int*)(&b));
pFun();
调用void Base::f()函数时,this指针指向什么?
   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-09-15 15:51  coolpoint
这个写得太精彩了   回复    更多评论
  

#  re: C++虚函数表解析(转)[未登录] 2009-09-16 10:16  smart
b1->f1(); //编译出错
应该是b1->g1(); //编译出错 吧
因为Base1的虚表中有Derive的虚函数有f()和g1(),f()重载了B1,而g1()没有,所以b1->g1(); //编译出错 吧   回复    更多评论
  

#  re: C++虚函数表解析(转) 2009-09-22 12:58  虚怀若谷
如果加上多重继承中虚继承的分析就更好了。  

#  re: C++虚函数表解析(转) 2009-10-05 11:21  程少伟
同意你的观点哈,因为虚函数表的指针放在对象的前面,所以(int*)(&b)其实是对象的首地址, 也就是对象中存放虚函数指针的地方,用* 解引用才能访问虚函数表,我的理解是这样的,@sky

另外,b1->g1() 编译可以通过, 在我的VS2008 环境下可以
@smart
   回复    更多评论
 
#  re: C++虚函数表解析(转) 2010-03-07 20:59  Coastline
请问博主,如何运行时获知虚函数表中有多少个函数指针呢,难道只能一个一个遍历,发现NULL或者1?
我主要是想在无RTTI的平台上实现如下功能:
class C: public A,public B
现在将C* ---> void* 后,需要调用到C中B部分的虚函数。我只想到处理虚函数表一个解决方法了。希望博主能指点
IBN#live.com  

#  re: C++虚函数表解析(转)[未登录] 2010-04-20 23:13  jeff
(Fun)*((int*)*(int*)(&b)+0); // Base::f()

(Fun)*((int*)*(int*)(&b)+1); // Base::g()

(Fun)*((int*)*(int*)(&b)+2); // Base::h()

在vs2005 下没有运行结果啊,

pFun =(Fun)*((int*)*(int*)(&b)+1);
pFun();
这样就可以。为什么啊

   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-04-25 10:01  snow_man2004
写得很好,思路很清晰,透彻,谢谢!   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-05-12 10:56  yanle
@zdwsj
@sky
言之是理。(int*)(&b)不是虚函数表的地址,而是实例中虚函数表指针的地址才对。而(int*)*((int*)(&b))才应该是虚函数表的首地址,也是第一个虚函数的地址。   回复    更多评论  

#  re: C++虚函数表解析(转) 2010-06-12 18:46  没名字
例子说明有点问题:

typedef void(*Fun)(void);

Base b;

Fun pFun = NULL;

cout << "虚函数表地址:" << (int*)(&b) << endl; // 错了,这应该是B的实例对象的地址。

cout << "虚函数表 — 第一个函数地址:" << (int*)*(int*)(&b) << endl;

// 因为虚表放在最前面,这次取到的才是虚表的地址。

pFun = (Fun)*((int*)*(int*)(&b)); // 这个才是第一个虚函数的地址

另,虚表是属于类的,同一类的实例共享一个虚表,所以虚表不是在实例的内存中。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-07-29 18:45  凋零的羽
@没名字 你确定吗? 我看这个看了一下午这个例子,总觉得说的自相矛盾。然后自己得出的结论正好是跟你一样的。。。也就是如你所说的,第一次取的是实例对象地址,第二次取的才是虚表地址,这样我就能看通了。。。
   回复    更多评论
  

#  re: C++虚函数表解析(转)[未登录] 2010-08-25 00:26  123
里面有些概念是错误的   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-08-26 17:04  ccnlzp
太过肤浅了,没有说出问题的实质。
而且不同意做的批判。因为最终数据放内存里,你想,怎么玩什么语言都难以阻拦.   回复    更多评论
  

#  re: C++虚函数表解析(转)[未登录] 2010-08-27 00:25  sam
虚函数表的第一项不是一个为了支持RTTI的指针吗?然后才是虚函数。
现在这里为什么第一项是虚函数?编译器做了动作?请问楼主在什么环境下试验的?   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-09-12 20:31  Liyx
如果能再讨论一下虚继承下的情形就好了。对D类的大小不太理解。
class A
{
};
class B
{
};
//sizeof(C)=4
class C:virtual public A, public B
{
};
//sizeof(D)=8
class D:virtual public A, virtual public B
{
};
================================
class A
{
virtual void funca(){};
};
class B
{
virtual void funcb() {};
};
//sizeof(C)=4
class C:virtual public A, public B
{
};
//sizeof(D)=12
class D:virtual public A, virtual public B
{
};   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-09-19 14:30  vmlinz
@没名字
实例会有类的指针   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-09-21 15:58  simophin
多谢楼主的好文章,这文章非常棒,解决了我很多疑问。
但是我对你的批判有一些看法,很多C++等的安全限制等个人感觉只是“编译时”除错、保证规则用的,你非要说运行时类似安全问题,你一个指针访问进程地址空间的哪一部分不可以?你只要知道了内存布局,无论是C还是C++还是C+++,不都一样地访问吗?所以这并非C++的错。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2010-10-09 16:14  solu
第一次看你这篇文章时,看不懂;
第二次看你这篇文章时,感觉写的太好了,叹为高人;
第三次看你这篇文章时,感觉作者你对某些方面了解得不够,有些地方很是糊囵吞枣,知其然不知其所以然。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2011-04-03 21:35  zhanglibin
一事不明,
抽象类生不生成虚表?   回复    更多评论
  

#  re: C++虚函数表解析(转)[未登录] 2011-07-22 13:02  小四
(int*)(&b)得到的不是虚函数表的地址吧,仅仅是实例b的地址。虚函数表的地址应该是对该地址对应的内容,即*(int*)(&b)。   回复    更多评论
  

#  re: C++虚函数表解析(转) 2011-10-05 21:59  天外一星
有指针指向首地址,虚函数表后有结束标记,因此无需知道长度@小熊
   回复    更多评论
  
#  re: C++虚函数表解析(转) 2012-02-25 15:20  寝室没电
@zhangwh
这位说的很OK
(int*)(&b)) 同等于 this指针   回复    更多评论
  



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值