C++ 对象模型之 DATA 语义
1. 单继承内存布局
在只有继承没有多态的情况下,子类是的内容就是父类加上子类特有的数据成员
class Point2d {
public:
float x;
float y;
};
class Point3d : public Point2d {
public:
float x;
float y;
float z;
};
内存布局:
在某些情况下,把一个类分解成多层,可能会导致类所占用空间的膨胀(主要是内存对齐问题)。如
class Concrete {
int val;
char c1;
char c2;
char c3;
}; // 8 字节
class Concrete1 {
int val;
char c1;
}; // 8 字节
class Concrete2 : public Concrete1 {
char c2;
}; // 12 字节
class Concrete3 : public Concrete2 {
char c2;
}; // 16 字节
内存布局:
为什么不把Concrete2和Concrete3的数据填补到Concrete1用于对齐的空间中呢?原因时,在此种情况下,当发生Concrete1的复制操作时,会破坏Concrete2的内容。
注意:合理的声明对象数据可以有效的节省内存。
2. 存在虚函数的情况
class Point2d {
public:
float x;
float y;
virtual float y1() { return y; }
}; // 16 字节
class Point3d : public Point2d {
public:
float z;
virtual float z1() { return z; }
}; // 24 字节
内存布局:需要新增虚表指针。
此时会带来额外的空间以及存取时间上的额外负担:
a. 虚函数表会被产生出来(virtual table)。
b. 每一个类对象中会加入一个指向上述虚表的指针(vptr)。
c. 加强构造函数,使之可以为vptr设定初值。
d. 加强析构函数,使之可以清除指向虚函数表的vptr。
3.多重继承
内存布局:
从上图看以看出,最左端基类(P2d和P3d)的起始地址和子类V3d是一样的,而之后的基类Vertex则和子类不一致,因此,对于如下对象和指针:
Vertex3d v3d;
Vertex* pv;
Point2d* p2d;
Point3d* p3d;
如下的赋值操作:pv = v3d; 需要内部转化为:pv = (Vertex*)(((char*)&v3d) + sizeof(Point3d));即需要偏移才可以指向子类中对应的该基类的部分,而对于如下赋值:p2d = &v3d;p3d = &v3d; 则不需要任何调整。
如果要存取第二个或者后继基类中的一个数据成员,并不需要额外负担,因为数据成员的位置在编译时期就固定了,因此存取只是一个简答的位移(offset)运算,并不需要额外成本。
4.虚拟继承
虚拟继承的情况,考虑如下继承体系,Vertex和Point3d虚拟继承自Point2d,Vertex3d共有继承(非虚继承)自Vertex和Point3d。
a. 此时必须有在子类对象中安插指针指向虚基类,一种可能的布局如下,子类需要维护指向虚基类地址的指针
b. 虚基类的偏移量(而不是地址)存入虚表中(以下例子中,虚表中的正值索引会索引到虚函数地址,负值索引会索引到虚基类偏移量),也就是与虚函数放到一个表中,针对上例,此种策略下可能的布局如下,此种策略下,上述+=运算符会被转化为
由于虚拟继承的存在带来了额外的负担以及高度的复杂性,所以,一般而言,“虚基类的最有效的运用形式就是:一个抽象的虚基类,没有任何数据成员。
类B和类C通过虚继承的方式派生自类A,这两个对象的内存布局中,编译器在对象中添加了一个vbptr(virtual base pointer)指针,vbptr指向了一张表,这张表保存了当前的虚指针相对于虚基类的首地址的偏移量。类D派生与类B和类C,继承了两个基类的vbptr指针,并调整了vbptr与虚基类的首地址的偏移量,使得这种菱形问题在继承时只继承一份数据,并且解决了二义性的问题。
当使用虚继承时,虚基类是被共享的,也就是在继承体系中无论被继承多少次,对象内存模型中都只会出现一个虚基类的子对象。
5.参考博客
了vbptr与虚基类的首地址的偏移量,使得这种菱形问题在继承时只继承一份数据,并且解决了二义性的问题。
当使用虚继承时,虚基类是被共享的,也就是在继承体系中无论被继承多少次,对象内存模型中都只会出现一个虚基类的子对象。