C语言——结构体内存对齐(计算结构体占用的字节数)

    1. 结构体对齐问题

struct S
{
	char a;
	int b;
	char c;
};

如果不考虑或者不存在内存对齐问题,这个结构体应该占1+4+1 = 6个字节,然而事实上它占了12个字节,???,这就涉及到内存对齐问题了。

结构体中的成员可以是不同的数据类型,成员按照定义时的顺序依次存储在连续的内存空间,和数组不一样的是,结构体的大小不是所有成员大小简单的相加,需要考虑到系统在存储结构体变量时的地址对齐问题

2. 如何对齐的

 VS编译器默认对齐(#pragma pack(n))的数值是8  linux下默认是4。

2.1 自然对界

struct 是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float 等)的变量,也可以是一些复合数据类型(如array、struct、union 等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界(natural alignment)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
【注】自然对界(natural alignment)即默认对齐方式,是指按结构体的成员中size 最大的成员对齐。注:这里的最大指整形数据,实型,结构体成员不在此例。见后面实例程序。

(1)存储变量时地址要求对齐,编译器在编译程序时会遵循两条原则:

(1)结构体变量中成员的偏移量必须是成员大小的整数倍(0被认为是任何数的整数倍)(自然对界)、或者必须是指定对界的整数倍。
(2)结构体大小必须是所有成员大小的整数倍,也即所有成员大小的公倍数(自然对界)、或者指定对界的整数倍。

(2) 对于嵌套的结构体,需要将其展开。对结构体求sizeof时,上述两种原则变为:

(1)展开后的结构体的第一个成员的偏移量应当是被展开的结构体中最大的成员的整数倍。
(2)结构体大小必须是所有成员大小的整数倍,这里所有成员计算的是展开后的成员,而不是将嵌套的结构体当做一个整体。

    2.2 指定对界

一般地,可以通过下面的方法来改变缺省的对界条件:

  • 使用伪指令#pragma pack (n),编译器将按照n 个字节对齐;
  • 使用伪指令#pragma pack (),取消自定义字节对齐方式。

【注】如果#pragma pack (n)中指定的n 大于结构体中最大成员的size,则其不起作用,结构体仍然按照size 最大的成员进行对界。
 

另外,GCC还有如下的一种方式:

__attribute((aligned (n))),让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。
__attribute__ ((packed)),取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。
 

(1)存储变量时地址要求对齐,编译器在编译程序时会遵循两条原则:

(1)结构体变量中成员的偏移量必须是指定对界和成员大小相比较小的那个值的整数倍。
(2)结构体大小必须是指定对界和成员大小相比较小的那个值的整数倍。

(2) 对于嵌套的结构体,需要将其展开。对结构体求sizeof时,上述两种原则变为:

(1)展开后的结构体的第一个成员的偏移量应当是指定对界和成员大小相比较小的那个值的整数倍。
(2)结构体大小必须是指定对界和成员大小相比较小的那个值的整数倍。

3. 例子

3.1 自然对界

例一

struct S1
{
    char c1;
    char c2;
    int i;
};
printf("%d\n", sizeof(struct S1));

结果是8,我们来分析一下为什么结果是 8??

  • c1是char型,占一个字节,第一个成员即 c1 在结构体变量偏移量为0 的地址处。
  • c2是char型,占一个字节,要对齐到对齐数的整数倍的位置,char类型的对齐数是1,所以对齐到1 的整数倍,那就是偏移量为1开始的地址空间。
  • i是int类型,占四个字节,要对齐到对齐数的整数倍的位置。int类型的对齐数就是 4,所以对齐到4 的整数倍,前面两个c1和c2占两个字节,所以得补两个字节,使得i之前为4字节就可以了。

我们来看一下内存分布图:

例二

struct S2
{
    char c1;
    int i;
    char c2;
};
printf("%d\n", sizeof(struct S2));

结果是12,来看一下过程?

  • c1是char型,占一个字节,对应到结构体变量偏移量为0 的地址处。
  • i是int型,占四个字节,对齐数就是4,对齐到4的整数倍位置处,即偏移量为4开始的地址空间,那c1后面有三个字节是不用的。
  • c2是char型,占一个字节,对齐到1 的整数倍,那就是下一个地址空间,对齐到偏移量为8的地址空间。

但是整个结构体为了整体对齐,得是4的整数倍,所以c2后面补三个字节,那么总大小就是12个字节空间。所以输出结果是12。

看一下内存分布图:

例三

struct S3
{
    double d;
    char c;
    int i;
};
struct S4
{
    char c1;
    struct S3 s3;
    double d;
};
printf("%d\n", sizeof(struct S4));

结果是32,分析:
struct S3占16个字节。(8、1+3、4)
struct S4中有三个成员变量:

  • 第一个char型,占一个字节,对齐到偏移量为0的地址处。
  • 第二个成员是结构体嵌套使用,刚才已经得出占16个字节,计算对齐数要拆开结构体来看, d为8字节,所以c1补7字节。
  • 第三个成员是double型,占8个字节,前面是1+7和16,共24,是8的整数倍,所以对应偏移量24的地址处。
  • 整体看一下,32字节,也是最大成员8字节的整数倍,OK。

所以是32。

3.2 指定对界

例一

#pragma pack(2)

struct S1
{
    char c1;
    char c2;
    int i;
};
printf("%d\n", sizeof(struct S1));

 指定为2字节对齐,结构体大小为6字节。

  •  第一个c1一字节,偏移0;
  • 第二个c2一字节,指定对界为2字节,成员只有1字节,直接偏移1字节就行。
  • 第三个i为四字节,指定对界为2字节,成员自己数4字节更大,按照2字节对齐,前面正好2个字节,所以偏移2字节就好。这个4字节会被分成两段存储,那么我们取该变量值时就得从内存中取两次,或多或少降低了效率,也是所说的用时间换空间。
  • 总的看一下,6字节,是2的整倍数。

例二

#pragma pack(2)
struct S2
{
    char c1;
    int i;
    char c2;
};
printf("%d\n", sizeof(struct S2));

 指定为2字节对齐,结构体大小为8字节。

  •  第一个c1一字节,偏移0;
  • 第二个i 四字节,按照2字节对齐,前面只有1字节,得补1字节,所以偏移2,并且分为两段。
  • 第三个c2一字节,指定对界为2字节,前面6个字节,紧挨着放就可以了,偏移6。
  • 总的看一下,7字节,不是2的整倍数,最后面补1位。

总共占8字节。

4. 总结

  • 如果没有指定对界,那我们就看成员,每个成员安排存储空间时,看之前的空间大小是否是自己大小的整数倍,不是就补。最后结构体大小取决于最大的成员的大小,得是最大成员大小的整数倍。
  • 当指定了对界,如果指定的对界大于所有成员的大小,那其实是不起作用的,就相当于未指定对界;
  • 当指定了对界,如果结构体存在成员大小是大于对界大小的,那么我们指定的对界值才有意义,且存在的这个成员得分段存储。即小于对界值的成员按照自己大小整数倍偏移,大于对界值的按对界值整数倍偏移,最终结构体大小就是是指定对界的整数倍。

5. 为什么存在内存对齐呢?

(1)平台原因(移植原因):
不是所有的硬件平台都能访问任意地址的任意数据的;某些平台只能在某些地址处取某些特定类型的数据

(2)性能原因:
数据结构尤其是栈应该尽可能在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次访问内存;而对齐的内存访问仅需要一次访问。

缺点:无可厚非:这必然会存在效率问题,这是一种以空间换时间的做法,但这种做法是值得的

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值