成员函数指针与高性能的C委托（中篇）

最新推荐文章于 2022-02-25 19:38:17 发布

JustinVisa

最新推荐文章于 2022-02-25 19:38:17 发布

阅读量669

点赞数

文章标签： c 编译器 borland c++ inheritance struct

成员函数指针——为什么那么复杂？
　　类的成员函数和标准的C函数有一些不同。与被显式声明的参数相似，类的成员函数有一个隐藏的参数this，它指向一个类的实例。根据不同的编译器，this或者被看作内部的一个正常的参数，或者会被特别对待（比如，在VC++中，this一般通过ECX寄存器来传递，而普通的成员函数的参数被直接压在堆栈中）。this作为参数和其他普通的参数有着本质的不同，即使一个成员函数受一个普通函数的支配，在标准C++中也没有理由使这个成员函数和其他的普通函数（ordinary function）的行为相同，因为没有thiscall关键字来保证它使用像普通参数一样正常的调用规则。成员函数是一回事，普通函数是另外一回事（Member functions are from Mars, ordinary functions are from Venus）。
　　
　　你可能会猜测，一个成员函数指针和一个普通函数指针一样，只是一个代码指针。然而这种猜测也许是错误的。在大多数编译器中，一个成员函数指针要比一个普通的函数指针要大许多。更奇怪的是，在Visual C++中，一个成员函数指针可以是4、8、12甚至16个字节长，这取决于它所相关的类的性质，同时也取决于编译器使用了怎样的编译设置！成员函数指针比你想象中的要复杂得多，但也不总是这样。
　　
　　让我们回到二十世纪80年代初期，那时，最古老的C++编译器CFront刚刚开发完成，那时C++语言只能实现单一继承，而且成员函数指针刚被引入，它们很简单：它们就像普通的函数指针，只是附加了额外的this作为它们的第一个参数，你可以将一个成员函数指针转化成一个普通的函数指针，并使你能够对这个额外添加的参数产生足够的重视。
　　
　　这个田园般的世界随着CFront 2.0的问世被击得粉碎。它引入了模版和多重继承，多重继承所带来的破坏造成了成员函数指针的改变。问题在于，随着多重继承，调用之前你不知道使用哪一个父类的this指针，比如，你有4个类定义如下：
　　
　　class A {
　　
　　public:
　　
　　virtual int Afunc() { return 2; };
　　
　　};
　　
　　class B {
　　
　　public:
　　
　　int Bfunc() { return 3; };
　　
　　};
　　
　　// C是个单一继承类，它只继承于A
　　
　　class C: public A {
　　
　　public:
　　
　　int Cfunc() { return 4; };
　　
　　};
　　
　　// D 类使用了多重继承
　　
　　class D: public A, public B {
　　
　　public:
　　
　　int Dfunc() { return 5; };
　　
　　};
　　
　　假如我们建立了C类的一个成员函数指针。在这个例子中，Afunc和Cfunc都是C的成员函数，所以我们的成员函数指针可以指向Afunc或者Cfunc。但是Afunc需要一个this指针指向C::A(后面我叫它Athis)，而Cfunc需要一个this指针指向C（后面我叫它Cthis）。编译器的设计者们为了处理这种情况使用了一个把戏（trick）：他们保证了A类在物理上保存在C类的头部（即C类的起始地址也就是一个A类的一个实例的起始地址），这意味着Athis == Cthis。我们只需担心一个this指针就够了，并且对于目前这种情况，所有的问题处理得还可以。
　　
　　现在，假如我们建立一个D类的成员函数指针。在这种情况下，我们的成员函数指针可以指向Afunc、Bfunc或Dfunc。但是Afunc需要一个this指针指向D::A，而Bfunc需要一个this指针指向D::B。这时，这个把戏就不管用了，我们不可以把A类和B类都放在D类的头部。所以，D类的一个成员函数指针不仅要说明要指明调用的是哪一个函数，还要指明使用哪一个this指针。编译器知道A类占用的空间有多大，所以它可以对Athis增加一个delta = sizeof(A)偏移量就可以将Athis指针转换为Bthis指针。
　　
　　如果你使用虚拟继承（virtual inheritance），比如虚基类，情况会变得更糟，你可以不必为搞懂这是为什么太伤脑筋。就举个例子来说吧，编译器使用虚拟函数表（virtual function table——“vtable”）来保存每一个虚函数、函数的地址和virtual_delta：将当前的this指针转换为实际函数需要的this指针时所要加的位移量。
　　
　　综上所述，为了支持一般形式的成员函数指针，你需要至少三条信息：函数的地址，需要增加到this指针上的delta位移量，和一个虚拟函数表中的索引。对于MSVC来说，你需要第四条信息：虚拟函数表（vtable）的地址。
　　
　　 成员函数指针的实现
　　那么，编译器是怎样实现成员函数指针的呢？这里是对不同的32、64和16位的编译器，对各种不同的数据类型（有int、void*数据指针、代码指针（比如指向静态函数的指针）、在单一（single-）继承、多重（multiple-）继承、虚拟（virtual-）继承和未知类型（unknown）的继承下的类的成员函数指针）使用sizeof运算符计算所获得的数据：
　　

　　注：
　　
　　# 表示使用__single/__multi/__virtual_inheritance关键字的时候代表4、8或12。
　　
　　这些编译器是Microsoft Visual C++ 4.0 to 7.1 (.NET 2003), GNU G++ 3.2 (MingW binaries, http://www.mingw.org/), Borland BCB 5.1 (http://www.borland.com/), Open Watcom (WCL) 1.2 (http://www.openwatcom.org/), Digital Mars (DMC) 8.38n (http://www.digitalmars.com/), Intel C++ 8.0 for Windows IA-32, Intel C++ 8.0 for Itanium, (http://www.intel.com/), IBM XLC for AIX (Power, PowerPC), Metrowerks Code Warrior 9.1 for Windows (http://www.metrowerks.com/), 和 Comeau C++ 4.3 (http://www.comeaucomputing.com/). Comeau的数据是在它支持的32位平台（x86, Alpha, SPARC等）上得出的。16位的编译器的数据在四种DOS配置（tiny, compact, medium, 和 large）下测试得出，用来显示各种不同代码和数据指针的大小。MSVC在/vmg的选项下进行了测试，用来显示“成员指针的全部特性”。（如果你拥有在列表中没有出现的编译器，请告知我。非x86处理机下的编译器测试结果有独特的价值。）
　　
　　看着表中的数据，你是不是觉得很惊奇？你可以清楚地看到编写一段在一些环境中可以运行而在另一些编译器中不能运行的代码是很容易的。不同的编译器之间，它们的内部实现显然是有很大差别的；事实上，我认为编译器在实现语言的其他特性上并没有这样明显的差别。对实现的细节进行研究你会发现一些奇怪的问题。
　　
　　一般，编译器采取最差的，而且一直使用最普通的形式。比如对于下面这个结构：
　　
　　// Borland (缺省设置) 和Watcom C++.
　　
　　struct {
　　
　　FunctionPointer m_func_address;
　　
　　int m_delta;
　　
　　int m_vtable_index; //如果不是虚拟继承，这个值为0。
　　
　　};
　　
　　// Metrowerks CodeWarrior使用了稍微有些不同的方式。
　　
　　//即使在不允许多重继承的Embedded C++的模式下，它也使用这样的结构！
　　
　　struct {
　　
　　int m_delta;
　　
　　int m_vtable_index; // 如果不是虚拟继承，这个值为-1。
　　
　　FunctionPointer m_func_address;
　　
　　};
　　
　　// 一个早期的SunCC版本显然使用了另一种规则：
　　
　　struct {
　　
　　int m_vtable_index; //如果是一个非虚拟函数（non-virtual function），这个值为0。
　　
　　FunctionPointer m_func_address; //如果是一个虚拟函数（virtual function），这个值为0。
　　
　　int m_delta;
　　
　　};
　　
　　//下面是微软的编译器在未知继承类型的情况下或者使用/vmg选项时使用的方法：
　　
　　struct {
　　
　　FunctionPointer m_func_address;
　　
　　int m_delta;
　　
　　int m_vtordisp;
　　
　　int m_vtable_index; // 如果不是虚拟继承，这个值为0
　　
　　};
　　
　　// AIX (PowerPC)上IBM的XLC编译器：
　　
　　struct {
　　
　　FunctionPointer m_func_address; // 对PowerPC来说是64位
　　
　　int m_vtable_index;
　　
　　int m_delta;
　　
　　int m_vtordisp;
　　
　　};
　　
　　// GNU g++使用了一个机灵的方法来进行空间优化
　　
　　struct {
　　
　　union {
　　
　　FunctionPointer m_func_address; // 其值总是4的倍数
　　
　　int m_vtable_index_2; // 其值被2除的结果总是奇数
　　
　　};
　　
　　int m_delta;
　　
　　};
　　
　　对于几乎所有的编译器delta和vindex用来调整传递给函数的this指针，比如Borland的计算方法是：
　　
　　adjustedthis = *(this + vindex -1) + delta // 如果vindex!=0
　　
　　adjustedthis = this + delta // 如果vindex=0
　　
　　（其中，“*”是提取该地址中的数值，adjustedthis是调整后的this指针——译者注）
　　
　　Borland使用了一个优化方法：如果这个类是单一继承的，编译器就会知道delta和vindex的值是0，所以它就可以跳过上面的计算方法。
　　
　　GNU编译器使用了一个奇怪的优化方法。可以清楚地看到，对于多重继承来说，你必须查看vtable（虚拟函数表）以获得voffset（虚拟函数偏移地址）来计算this指针。当你做这些事情的时候，你可能也把函数指针保存在vtable中。通过这些工作，编译器将m_func_address和m_vtable_index合二为一（即放在一个union中），编译器区别这两个变量的方法是使函数指针（m_func_address）的值除以2后结果为偶数，而虚拟函数表索引(m

JustinVisa

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
成员函数指针与高性能的C委托（中篇）

成员函数指针——为什么那么复杂？　　类的成员函数和标准的C函数有一些不同。与被显式声明的参数相似，类的成员函数有一个隐藏的参数this，它指向一个类的实例。根据不同的编译器，this或者被看作内部的一个正常的参数，或者会被特别对待（比如，在VC++中，this一般通过ECX寄存器来传递，而普通的成员函数的参数被直接压在堆栈中）。this作为参数和其他普通的参数有着本质的不同，即使一个成员函数受一个
复制链接

扫一扫