我们都知道C++多态是通过虚函数表来实现的,那具体是什么样的大家清楚吗?开篇依旧提出来几个问题:
-
普通类对象是什么布局?
-
带虚函数的类对象是什么布局?
-
单继承下不含有覆盖函数的类对象是什么布局?
-
单继承下含有覆盖函数的类对象是什么布局?
-
多继承下不含有覆盖函数的类对象是什么布局?
-
多继承下含有覆盖函数的类对象的是什么布局?
-
多继承中不同的继承顺序产生的类对象布局相同吗?
-
虚继承的类对象是什么布局?
-
菱形继承下类对象是什么布局?
-
为什么要引入虚继承?
-
为什么虚函数表中有两个析构函数?
-
为什么构造函数不能是虚函数?
-
为什么基类析构函数需要是虚函数?
要回答上述问题我们首先需要了解什么是多态。
什么是多态?
多态可以分为编译时多态和运行时多态。
-
编译时多态:基于模板和函数重载方式,在编译时就已经确定对象的行为,也称为静态绑定。
-
运行时多态:面向对象的一大特色,通过继承方式使得程序在运行时才会确定相应调用的方法,也称为动态绑定,它的实现主要是依赖于传说中的虚函数表。
如何查看对象的布局?
在gcc中可以使用如下命令查看对象布局:
g++ -fdump-class-hierarchy model.cc后查看生成的文件
在clang中可以使用如下命令:
clang -Xclang -fdump-record-layouts -stdlib=libc++ -c model.cc
// 查看对象布局
clang -Xclang -fdump-vtable-layouts -stdlib=libc++ -c model.cc
// 查看虚函数表布局
上面两种方式其实足够了,也可以使用gdb来查看内存布局,这里可以看文末相关参考资料。本文都是使用clang来查看的对象布局。
接下来让我们一起来探秘下各种继承条件下类对象的布局情况吧~
普通类对象的布局
如下代码:
struct Base {
Base() = default;
~Base() = default;
void Func() {}
int a;
int b;
};
int main() {
Base a;
return 0;
}
// 使用clang -Xclang -fdump-record-layouts -stdlib=libc++ -c model.cc查看
输出如下:
*** Dumping AST Record Layout
0 | struct Base
0 | int a
4 | int b
| [sizeof=8, dsize=8, align=4,
| nvsize=8, nvalign=4]
*** Dumping IRgen Record Layout
画出图如下:
从结果中可以看见,这个普通结构体Base的大小为8字节,a占4个字节,b占4个字节。
带虚函数的类对象布局
struct Base {
Base() = default;
virtual ~Base() = default;
void FuncA() {}
virtual void FuncB() {
printf("FuncB\n");
}
int a;
int b;
};
int main() {
Base a;
return 0;
}
// 这里可以查看对象的布局和相应虚函数表的布局
clang -Xclang -fdump-record-layouts -stdlib=libc++ -c model.cc
clang -Xclang -fdump-vtable-layouts -stdlib=libc++ -c model.cc
对象布局如下:
*** Dumping AST Record Layout
0 | struct Base
0 | (Base vtable pointer)
8 | int a
12 | int b
| [sizeof=16, dsize=16, align=8,
| nvsize=16, nvalign=8]
*** Dumping IRgen Record Layout
这个含有虚函数的结构体大小为16,在对象的头部,前8个字节是虚函数表的指针,指向虚函数的相应函数指针地址,a占4个字节,b占4个字节,总大小为16。
虚函数表布局:
Vtable for 'Base' (5 entries).
0 | offset_to_top (0)
1 | Base RTTI
-- (Base, 0) vtable address --
2 | Base::~Base() [complete]
3 | Base::~Base() [deleting]
4 | void Base::FuncB()
画出对象布局图如下:
我们来探秘下传说中的虚函数表:
offset_to_top(0):表示当前这个虚函数表地址距离对象顶部地址的偏移量,因为对象的头部就是虚函数表的指针,所以偏移量为0。
RTTI指针:指向存储运行时类型信息(type_info)的地址,用于运行时类型识别,用于typeid和dynamic_cast。
RTTI下面就是虚函数表指针真正指向的地址啦,存储了类里面所有的虚函数,至于这里为什么会有两个析构函数,大家可以先关注对象的布局,最下面会介绍。
单继承下不含有覆盖函数的类对象的布局
struct Base {
Base() = default;
virtual ~Base() = default;
void FuncA() {}
virtual void FuncB() {
printf("Base FuncB\n");
}
int a;
int b;
};
struct Derive : public Base{
};
int main() {
Base a;
Derive d;
return 0;
}
子类对象布局:
*** Dumping AST Record Layout
0 | struct Derive
0 | struct Base (primary base)
0 | (Base vtable pointer)
8 | int a
12 | int b
| [sizeof=16, dsize=16, align=8,
| nvsize=16, nvalign=8]
*** Dumping IRgen Record Layout
和上面相同,这个含有虚函数的结构体大小为16,在对象的头部,前8个字节是虚函数表的指针,指向虚函数的相应函数指针地址,a占4个字节,b占4个字节,总大小为16。
子类虚函数表布局:
Vtable for 'Derive' (5 entries).
0 | offset_to_top (0)
1 | Derive RTTI
-- (Base, 0) vtable address --
-- (Derive, 0) vtable address --
2 | Derive::~Derive() [complete]
3 | Derive::~Derive() [deleting]
4 | void Base::FuncB()
画图如下: