结构体字节对齐, 位段
1. 字节对齐
首先来看段代码 :
#include<stdio.h>
#include<stdlib.h>
typedef struct s1 {
char a;
int b;
char c;
}s1;
int main() {
printf("%d\n", sizeof(s1));
system("pause");
return 0;
}
我们定义的结构体类型成员包含一个 int 型(占4字节)成员, 两个char型(占1字节)成员, 我们会先入为主的认为该结构体占4 + 1 + 1 = 6个字节, 实则不然, 运行程序我们能发现, 该结构体占12个字节, 如图 :
这是什么原因造成的呢?(⊙o⊙)…
这是因为结构体会进行字节对齐, 那么问题又来了, 结构体为什么要进行字节对齐呢?(⊙o⊙)…
大部分的参考资料都是这样说的:
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
- 总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
知道了结构体会字节对齐的原因, 又冒出了心的问题, 上面代码中的结构体对齐后为什么是12而不是别的值呢?(⊙o⊙)…
这是因为字节对齐有着相应的规则 . 其规则如下 :
-
对齐规则
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到对齐数(每一个成员都有对齐数, 对齐数为自身类型所占字节数)的整数倍的地址处。
结构体对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。(Windows 中的VS中默认的值为8, Linux中的默认值为4)
- 结构体总字节数一定为最大对齐数的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体大小为这个嵌套的结构体本身按以上规则对齐后的字节数(但这个成员的对齐数为这个嵌套的结构体的对齐数),结构体的整体大小也按以上规则计算。
举个例子来看一下字节对齐规则 , 上代码 :
#include<stdio.h>
#include<stdlib.h>
struct S1
{
int i;
char c;
};
struct S2
{
char c1;//1
char c2;//1
struct S1 S;//8(对齐数为4)
int i;//4
};
int main() {
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
system("pause");
return 0;
}
运行结果如下:
可以看出, 虽然嵌套的结构体struct S1字节数为8, 但其对齐数为 4 , 所以结构体 struct S2 的对齐数并内有改变依然为4, 所以2个char型对齐到4, 再加上struct S1的 8 字节, 再加上 int型的4字节, 为16, 正好为最大对齐数的整数倍, 所以结果为16
既然存在字节对齐, 那么我们在声明结构体变量类型时可以尽可能地减少内存的浪费 .如何做呢?.(⊙o⊙)…
让占用空间小的成员尽量集中在一起。
举个例子, 上代码 :
#include<stdio.h>
#include<stdlib.h>
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
int main() {
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
system("pause");
return 0;
}
运行如下 :
我们可以看到, 当把所占空间字节数小的成员变量放在一起, 确实可以节省空间
-
修改默认对齐数
之前我们见过了#pragma 这个预处理指令(),这里我们再次使用,可以改变我们的默认对齐数。
举个例子, 上代码:
#include<stdio.h>
#include<stdlib.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
char c2;
int i;
};
int main() {
printf("%d\n", sizeof(struct S1));
system("pause");
return 0;
}
运行结果如下, 本来对齐数为4, 结构体对齐后也应该为4, 修改默认对齐数为8后, 按8对齐, 结构体对齐后字节数为8
2. 位段
学到结构体, 就不得不说结构体实现位段的能力。
-
什么是位段
位段的声明和结构是类似的,有两个不同:
- 1.位段的成员必须是int、unsigned int ,char , short , unsigned short , long , unsigned long , long long , unsigned long long (整型家族)。
- 2.位段的成员名后边有一个冒号和一个数字, 这个数字不能大于该成员类型所占最大bit位。
例如 :
在Windows系统VS编译器下 :
int a : 2;//int型占4字节32位,只分配2位
int b : 10;//int型占4字节32位,只分配10位
int c : 30;//int型占4字节32位,只分配30位
char d : 5;//char型占1字节8位,只分配4位
short e : 9;//short型占2字节16位,只分配9位
-
位段的内存分配
在Windows系统VS编译器下 :
1. 位段的成员可以是int、unsigned int ,char , short , unsigned short , long , unsigned long , long long , unsigned long long (整型家族)类型。
2. 位段的空间上是按照需要以4个字节( int 或 long), 1个字节( char ),或2个字节( short ) 或者8个字节(long long) 的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
几个例子 :
#include<stdio.h>
#include<stdlib.h>
typedef struct S
{
int a : 2;//int型占4字节32位,只分配2位
int b : 10;//int型占4字节32位,只分配10位
int c : 30;//int型占4字节32位,只分配30位
char d : 5;//char型占1字节8位,只分配4位
short e : 9;//short型占2字节16位,只分配9位
}S;
int main() {
S w;
printf("%d字节%dbit位\n", sizeof(w), sizeof(w) * 8);
system("pause");
return 0;
}
运行如下:
在内存中具体是如何存储的呢?(⊙o⊙)…
我们可以调试来查看内存 .如图:
位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。