字节对齐
对齐准则
先来看四个重要的基本概念:
1) 数据类型自身的对齐值:char型数据自身对齐值为1字节,short型数据为2字节,int/float型为4字节,double型为8字节。
2) 结构体或类的自身对齐值:其成员中自身对齐值最大的那个值。
3) 指定对齐值:#pragma pack (value)时的指定对齐值value。
4) 数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中较小者,即有效对齐值=min{自身对齐值,当前指定的pack值}。
基于上面这些值,就可以方便地讨论具体数据结构的成员和其自身的对齐方式。
其中,有效对齐值N是最终用来决定数据存放地址方式的值。有效对齐N表示“对齐在N上”,即该数据的“存放起始地址%N=0”。而数据结构中的数据变量都是按定义的先后顺序存放。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐存放,结构体本身也要根据自身的有效对齐值圆整(即结构体成员变量占用总长度为结构体有效对齐值的整数倍)。
例子
pragma pack (4)
struct B
{
char a;
int b;
short c;
}
sizeof(struct B)的值是12
数据类型自身的对齐值分别为char(1),int(4),short(2);
结构体的自身对齐值为4,取数据类型的对齐值的最大值;
指定对齐值4;
数据成员值的有效对齐值分别为char(1),int(4),short(2);注:和指定对齐值得比较;
结构体(类)的有效对齐值为4 ; 注:和指定对齐值得比较;
指定对齐为4
第一个结构体的元素是结构的首地址,通常偏移值为0;
a的首地址 0x0000%1 = 0 地址为0x0000
b的首地址 0x0004%4 = 0 地址为0x0004-0x0007
c的首地址 0x0008%2 =0 地址为0x0008-0x0009
再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求, (10+2)%4=0,故结构体长度12个字节。
之所以编译器在后面补充2个字节,是为了实现结构数组的存取效率。试想如果定义一个结构B的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都紧挨着。如果我们不把结构体大小补充为4的整数倍,那么下一个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐。因此要把结构体补充成有效对齐大小的整数倍。其实对于char/short/int/float/double等已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知,所以他们的自身对齐值也就已知。