c/c++ struct union 对齐方式

昨天在工作中遇到了一个非常诡异的问题:STL标准库的空的set在insert元素的时候,竟然没有insert进去!在查了返回值之后发现返回值也是正确的,但是insert之后仍然为空,经过长时间的debug之后发现原来是结构体对齐的问题,在定义结构体的时候使用了

#pragma pack(1)

而并没有在最后取消对齐。才引发了对结构体对齐的思考


下面是我摘录的网上的解释:


有如下的两个结构体:

struct A                                       struct B         
{                                                {
int a;                                           int a;
unsigned __int64 b;                  short c;   
short c;                                      unsigned __int64 b;
};                                               };  

那么 sizeof(A) 和 sizeof(B) 一样吗?让我在编译器里试一下,啊 ? 怎么不一样?两个结构体明明相同,只是第二和第三个成员变量的位置颠倒了结果却大相径庭。到底是因为什么呢?

答案是编译器的数据对齐方式在作怪。以 vc6.0 为例,默认情况下的对其方式是 8 位。所以 struct A 的大小为 24 , struct B 的大小为 16, 下面就具体分析一下数据空间占用情况。

在 Struct A 中的 , 编译器首先检测所有的成员变量中的 size 最大值。很显然 unsigned __int64 最大, sizeof(unsigned __int64) 为 8 ,然后第一个变量 a 为 int 型只占 4 个字节,但是为了对齐其被补上了四个字节 , 接着变量 b 在 变量 a 有效位置之后被放置,但是目前只有 4 个空闲的字节,根本放不下变量 b ,于是编译器就再申请了 8 字节的空间大小,将变量 b 放在 4 个空闲字节之后,也就是说变量 b 的起始位置在第九个字节。由于变量 b 需要 8 个字节所以没有留给变量 c 任何的剩余空间,于是变量 c 再次申请 8 个字节的空间用于存储自己,当然它本可以只申请 2 字节的空前就行了,但是为了对齐他只能申请 8 字节。那么最后我们就可以看到如下图所示的数据存储结构:

0

8

15

16

23

a

多申请的空间

b

...

  c

多申请的空间


在 Struct B 中的 , 编译器前几步的处理也和 struct A 的一样,直到该处理变量 c 时,编译器依然要先看看为变量 a 分配的空间是否还有多余并且多余的空间是否足以容纳下变量 c, 由于变量 c 只需要两个字节,而 a 却有 4 个字节的剩余空间,所以变量 c 就很轻松的被放置在 a 之后的 4 个字节内而不需要再申请空间。变量 b 依然申请 8 字节的空间并跟随在变量 a 空余空间之后。最后我们就可以看到如下图所示的数据存储结构:     

0

1

2

3

4

5

6

7

8

15

a

 

 

 

c

 

多申请的空间

b

 


通过以上的分析我们明白了结构体内部 ( 也可以引伸到类的内部! ) 成员变量的声明顺序并不是随意的,尤其是在内存需求特别紧张的开发环境中。

对齐的目的和原理,计算

什么是对齐,以及为什么要对齐:

对齐的作用和原因:
各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。其他平 台可能没有这种情况, 但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为 32 位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结果的高低字节 进行拼凑才能得到该int数据。显然在读取效
率上下降很多。这也是空间和时间的博弈。

对齐的算法:
由于各个平台和编译器的不同,现以本人使用的gcc version 3.2.2编译器(32位x86平台)为例子,来讨论编译器对struct数据结构中的各成员如何进行对齐的。
设结构体如下定义:
struct A
{
int a;
char b;
short c;
};
结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长度的short型数据一个。所以A用到的空间应该是7字节。但是因为编译器要对数据成员在空间上进行对齐。
所以使用sizeof(strcut A)值为8。
现在把该结构体调整成员变量的顺序。
struct B
{
char b;
int a;
short c;
};
这时候同样是总共7个字节的变量,但是sizeof(struct B)的值却是12。
下面我们使用预编译指令#progma pack (value)来告诉编译器,使用我们指定的对齐值来取代缺省的。
#progma pack (2) /*指定按2字节对齐*/
struct C
{
char b;
int a;
short c;
};
#progma pack () /*取消指定对齐,恢复缺省对齐*/
sizeof(struct C)值是8。

修改对齐值为1:
#progma pack (1) /*指定按1字节对齐*/
struct D
{
char b;
int a;
short c;
};
#progma pack () /*取消指定对齐,恢复缺省对齐*/
sizeof(struct D)值为7。

对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。
这里面有四个概念值:
1.数据类型自身的对齐值:就是上面交代的基本数据类型的自身对齐值。
2.指定对齐值:#progma pack (value)时的指定对齐值value。
3.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。
4.  数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。 有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0".


转载出处:http://hi.baidu.com/pur_e/item/3fef8948ba492a0cc01613f2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值