联合体转载自这里
当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union)。在C Programming Language 一书中对于联合体是这么描述的:
1)联合体是一个结构;
2)它的所有成员相对于基地址的偏移量都为0;
3)此结构空间要大到足够容纳最"宽"的成员;
4)其对齐方式要适合其中所有的成员;
下面解释这四条描述:
由于联合体中的所有成员是共享一段内存的,因此每个成员的存放首地址相对于于联合体变量的基地址的偏移量为0,即所有成员的首地址都是一样的。
为了使得所有成员能够共享一段内存,因此该空间必须足够容纳这些成员中最宽的成员。对于这句“对齐方式要适合其中所有的成员”是指其必须符合所有成员的自身对齐方式。
示例:
union U
{
char s[9];
int n;
double d;
};
上面的程序中的,
s占9字节,n占4字节,d占8字节,因此其至少需9字节的空间。
然而其实际大小并不是9,用运算符sizeof测试其大小为16.
这是因为这里存在字节对齐的问题,9既不能被4整除,也不能被8整除。因此补充字节到16,这样就符合所有成员的自身对齐了。
从这里可以看出联合体所占的空间不仅取决于最宽成员,还跟所有成员有关系,即其大小必须满足两个条件:
1)大小足够容纳最宽的成员;
2)大小能被其包含的所有基本数据类型的大小所整除。
结构体转载自:这里
结构体内存对齐规则:
- 第一个成员在结构体变量偏移量为0 的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小中的较小值。vs中默认值是8 Linux默认值为4.
- 结构体总大小为最大对齐数的整数倍。(每个成员变量都有自己的对齐数)
- 如果嵌套结构体,嵌套的结构体对齐到自己的所有成员最大对齐数(就是该嵌套结构体的对齐数)的整数倍处,结构体的整体大小就是所有成员对齐数的最大值(包含嵌套结构体的对齐数)的整数倍。
内存对齐规则应用
接下来我们看一下具体怎么应用这几条规则??
struct S1
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S1));
结果是8,我们来分析一下为什么结果是 8??
c1是char型,占一个字节,第一个成员即 c1 在结构体变量偏移量为0 的地址处。
c2是char型,占一个字节,要对齐到对齐数的整数倍的位置。对齐数 = 编译器默认的一个对齐数与该成员大小中的较小值,vs中默认值是8,取较小值1,char类型的对齐数是1,所以对齐到1 的整数倍,那就是偏移量为1开始的地址空间。
i是int类型,占四个字节,要对齐到对齐数的整数倍的位置。int类型的对齐数就是 4,所以对齐到4 的整数倍。
我们来看一下内存分布图:
那我们再来看一下这个输出结果是多少呢
struct S2
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S2));
结果是12,来看一下过程?
c1是char型,占一个字节,对应到结构体变量偏移量为0 的地址处。
i是int型,占四个字节,对齐数就是4,对齐到4的整数倍位置处,即偏移量为4开始的地址空间。
c2是char型,占一个字节,对齐到1 的整数倍,那就是下一个地址空间,对齐到偏移量为8的地址空间。
结构体总大小为最大对齐数的整数倍,所以为对齐数4的整数倍,现在已经用了9个字节的空间,那么总大小就是12个字节空间。所以输出结果是12。
看一下内存分布图:
结构体也是可以嵌套使用的,那如果嵌套的话,大小是怎么判断的呢?
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));
结果是32,我们来看一下分析:
容易得出struct S3占16个字节。请读者自行分析,如果不会的话可以问我哦。
那我们来看一下struct S4的大小,struct S4中有三个成员变量,第一个char型,占一个字节,对齐到偏移量为0的地址处。第二个成员是结构体嵌套使用,结构体S3变量s3,刚才已经得出占16个字节,所以第二个成员对齐数是16,又因为对齐数是编译器默认数与成员对齐数中的较小值,vs默认对齐数是8,取较小值8,所以对齐到偏移量为8的地址空间。处。第三个成员是double型,占8个字节,对应到8的整数倍即偏移量24的地址处。
结构体总大小是最大对齐数16的整数倍,所以是32。
来看一下内存分布图:
为什么存在内存对齐呢?
平台原因(移植原因):
不是所有的硬件平台都能访问任意地址的任意数据的;某些平台只能在某些地址处取某些特定类型的数据
性能原因:
数据结构尤其是栈应该尽可能在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次访问内存;而对齐的内存访问仅需要一次访问。
缺点:
无可厚非:这必然会存在效率问题,这是一种以空间换时间的做法,但这种做法是值得的
而我在vc6上测试和上面说的不一样,如图:
实际的内存是这样子的:
似乎又可以总结出一套规律,所以说不必深究,有基本的概念和方法论就行了。
在做的比赛模拟题更恶心:
居然一点对齐的规则都不用,直接8+6+20=34,吐了。👳♂️
不知道这是什么彩笔编译环境: