内存对齐:
首先,先看一段代码:
我们可以看出上面那个结构体的长度为24,按照正常的计算方法,它的长度应该为14,但是现在却是24,这是什么原因呢?
原来在程序运行的过程中为了便于cpu快速访问,同时有效地节省存储空间。c中编译器会自动进行内存对齐。
那内存对齐具体的又是什么呢?
结构体数据内存对齐,是指结构体内的各个数据内存对齐。在结构体中的第一个成员的首地址等于整个结构体的变量的首地址,而后的成员的地址随着它声明的顺序和实际占用的字节递增。为了总的结构体大小对齐,会在结构体中插入一些没有实际意思的字符来填充(padding)结构体。
首先,每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数,对齐模数等于#pragma pack(n)所指定的n与结构体中最大数据类型的成员大小的最小值)。我们可以通过预编译命令#pragma
pack(n) n=1,2,4,8,16来改变这一系数,其中的n就是要指定的“对齐系数”。
然后就是内存对齐要遵守的规则:
在结构体中,成员数据对齐满足以下规则:
a、结构体中的第一个成员的首地址也即是结构体的首地址。
b、结构体中的每一个成员在存储时需要对齐到某个数字(对齐数)的整数倍处,即相对于结构体的首地址的偏移量(offset)应该对其到某个数字(对齐数)的整数倍处,那这个数字怎么求得呢? 对齐数 = 编译器默认对齐数的一个对齐数与该成员大小的较小值。
c、结构体的总大小是结构体中最大对齐数(结构体的每个成员都有一个对齐数)的整数倍,不足的要补齐。
d、如果一个结构体中嵌套了另一个结构体,嵌套的结构体(内部的结构体)对齐到自己的最大对齐数的整数倍处,结构体整体的大小就是所有最大对齐数的整数倍。
比如上面的那个例子
当存储到 char b 后,地址读取要直接读取到double c,就需要在b的后面补上7个空的字节,使它成为一个长度为8字节的类型,当最后一个char d存储完后,它的长度就为 4 + 1 +3 + 8 + 1 = 17(红色字体为补上去的内存,下同。) 又因为结构体的长度为结构体的总大小是结构体中最大对齐数的整数倍,不足的要补齐。,因此,应该给它补上3个字节,使它达到24,所以后面输出的结构体大小为24。
再看一个例子:
上面这两段代码按理来说应该是一样的,但是为什么它们的大小不一样呢?
我们一起来分析一下:
看第一段代码: 按照我们的分析,它的大小应该为 1 + 3 + 4 + 16 = 24,这是因为当我们计算B的大小时,首先计算的是前面两个基本类型,他们之间根据内存对齐应该给第一个大小加3再加上第二个的大小所以应该为 1 + 3 + 4 = 8,然后加由结构体A创建的变量,我们可以看到,A结构体大小为16,A的最大对齐数为8,而前面存完偏移值刚好到8,因此,直接用前面的加后面的A所以答案为8 + 16 = 24。又因为24为A,B 中总最大对齐数的8的整数倍,所以B的大小为24。
看第二段代码: 按照我们的分析,它的大小应该为 1 + 3 + 4 + 24 = 32,这是因为当我们计算B的大小时,首先计算的是前面两个基本类型,他们之间根据内存对齐应该给第一个大小加3再加上第二个的大小所以应该为 1 + 3 + 4 = 8,然后加由结构体A创建的变量的大小,我们可以看到,A的大小为 1 + 1 + 6 + 8 + 1 + 7 = 24 ,因此B的大小为8 + 24 = 32。又因为32为A,B 中对齐模数最大的8的整数倍,所以B的大小为32。
所以我们可以发现,结构体定义时,成员的定义先后顺序不同,结构体大小可能也不同,因此在定义结构体时,应注意定义的顺序。
以上就是我个人关于内存对齐的一些理解;
位域:
首先,介绍位域:
位域是指信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态, 用一位二进 位即可。为了节省存储空间,并使处理简便,C语言又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几 个不同的区域,并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。这样就可以把几个不同的对象用一个字节的二进制位域来表示。
位域定义: 与结构定义相仿,其形式为:
struct 位域结构名
{ 位域列表 };
其中位域列表的形式为: 类型说明符 位域名:位域长度
例如:
struct A
{
int a:8;
int b:2;
int c:6;
};
1. 宽度为 0 的一个未命名位域强制下一位域对齐到其下一type边界,其中type是该成员的类型。
struct bs
{
unsigned a:4;
unsigned :0 ;/*空域*/
char b:4 ;/*从下一单元开始存放*/
unsigned c:4;
}B;
实验中,0x0012ff74为变量B的起始地址,位域a填充0x0012ff74的后四位,位域b从0x0012ff78开始,占据0x0012ff78的后四位。所以空域占据了从a开始的4个位剩余部 分。乍看 VC6对空域的处理是依据空域的类型,即unsigned。其实不然。经试验,空域所占大小和 a的类型及 空域的类型 二者皆相关。
即以下四种情况:
1. a,空域皆为char时,二者共占据1字节;
2. a 为unsigned,空域为unsigned;
3. a 为char,空域为unsigned;
4. a 为unsigned,空域为char;
后三种情况,二者共占据4字节。
2. 位域的长度不能大于指定类型固有长度,比如说int的位域长度不能超过32,char 的位域长度不能超过8。
3. 位域可以无位域名,这时它只用来作填充或调整位置。无名的位域是不能使用的。例如:
struct A
{
int a:1
int :2 /*该2位不能使用*/
int b:3
int c:2
};
从以上分析可以看出,位域在本质上就是一种结构类型, 不过其成员是按二进位分配的。
同样看一段代码:
由代码我们可以看出,位域的作用,A的大小计算应该为: 4 + 1+ 1 +2 = 8;
如果当前字节位数不足,那么编译器会将下一个变量单独放置,比如上面的代码中的char c ,虽然运用了位域,但是一个char 是8位而 c占了两位,因此,d占了一块新的内存。
位域只有数据类型相同才能合并,比如b和c 因为数据类型不同,尽管int的位数够了,但是仍不能合并。
以上就是本人理解的位域内容。