目录:
一、结构体的对齐规则
二、为什么存在内存对齐
三、如何修改默认参数
正文:
在之前的文章中我们简单的介绍了结构体的基本概念,包括:什么是结构体、结构体类型的声明、结构体变量的创建与使用、结构体的访问操作符等,详情可以看之前的内容。
在掌握了结构体的基本知识之后,我们可能会好奇一件事:结构体的大小是多少?想要计算结构体的大小,我们就要了解一下什么是结构体的内存对齐
一、结构体的对齐规则:
1、结构体的第一个成员对齐到相对结构体变量起始位置偏移量为0的地址处。
2、其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处.
——其中对齐数=编译器默认的一个对齐数与该成员变量大小的较小值。
—— (VS中的默认对齐数是 8,Linux中没有默认对齐数,对齐数就是成员自身的大小)。
3、结构体的总大小为最大对齐数的整数倍。
最大对齐数:结构体中每个成员变量都有一个对齐数,所有对齐数中最大的。
4、如果一个结构体中嵌套了结构体,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(包括其嵌套结构体中成员的对齐数)的整数倍。
例:
在这个结构体中有两个char类型一个int类型,加起来应该是6个字节的大小,但是我们运行一下:
结果是这个结构体的实际大小是12个字节,那究竟是为啥呢?
实际根据结构体对齐规则:char c1 作为结构体中的第一个结构体变量,它要对齐到相对结构体变量起始位置偏移量为0的地址处,也就是图中的橙色部分,char 类型占据1字节。又因为规则中要求其他成员变量要对齐到对齐数的整数倍的地址处,因为VS的默认对齐数为8,int类型的字节大小为4,所以int i的对齐数就是4,所以要对齐到地址为4的地方,同理,char c2因为对齐数为1,所以放在i的下一个地址处。
但是这样加起来也就9字节的大小,又是如何出来12字节呢?这就是第三条规则:结构体的总大小应为最大对齐数的整数倍。在结构体S1中,对齐数分别为1,4,1,所以最大对齐数为4,因此S1的大小是4的倍数,所以是12个字节。图中红色的是没有用到的空间。
例2:
那这个结构体的大小是多少?还是12?
这样看来一样好似一样的结构体,它的大小却不相同。
实际上,还是要根据规则来:第一个成员变量char c1要放到相对结构体变量的起始位置偏移量为0的地址处,大小1字节。因为第二个变量也是char 类型,对齐数为1,所以直接放在第一个成员变量的后面,大小也是1字节。以此类推,i放到了地址4处,大小4个字节,因为最大对齐数为4,而8就是4的倍数,因此结构体的大小就是8字节。
到这,大家应该对前三条的规则有了大致的了解,那么结构体嵌套的规则是怎样的?
这是两个结构体,其中S3嵌套到了S4中。根据前面的知识,我们可以知道S3的结构体大小是16,那么S4的呢?
S4的大小是32,怎么算出来的?
这里我们就必须提到对齐规则的第4条:如果一个结构体中嵌套了结构体,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(包括其嵌套结构体中成员的对齐数)的整数倍。
因为s3的最大对齐数是8(double 字节大小是8),因此s3 对齐到了8地址处,又因为s3的大小为16个字节,所以double d被放到了24地址处(对齐数的整数倍处),加起来就是32字节。又因为所有的对齐数中最大的是8,32又是8的整数倍,因此S4的整体大小就是32字节。
二、为什么存在内存对齐
大部分的参考资料都是这样说的:
1. 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
假设处理器一次只能访问4子节,而没有内存对齐,char和int紧邻会使处理器读两次以求获得完整的数据,而内存对齐就使得我们要读取i时我们只读i处即可(仅读一次),提升了效率。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
空间不能一直浪费,所以设计结构时我们可以让占空间小的变量尽量放在一起,使得既符合对齐规则,又能少浪费空间。(比如上文的S1与S2,S2浪费的空间就比较小)
三、如何修改默认参数
#pragma 这个预处理指令,可以改变编译器的默认对⻬数。
结构体在对齐方式不合格时,我们就可以更改默认参数。