c/c++结构体和类字节对齐详解

什么是字节对齐?

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

为什么要对齐?

1. 需要字节对齐的根本原因在于CPU访问数据的效率问题。假设一个整型变量的地址不是自然对齐,比如为0x00000002,则CPU如果取它的值的话需要访问两次内存(在32位处理器的情况下),第一次取从0x00000002-0x00000003的一个short,第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据。而如果变量在自然对齐位置上,则只要一次就可以取出数据。

2. 各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐,其他平台可能没有这种情况。 一些系统对对齐要求非常严格,比如在MIPS或者sparc上,如果取未对齐的数据会发生错误,举个例:
char ch[8];

char *p = &ch[1];

int i = *(int *)p;

运行时会报segment error,而在x86上就不会出现错误,只是效率下降。

编译器是按照什么样的原则进行对齐的?

四个重要的概念:

1. 数据类型自身的对齐值,对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。

2. 结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。

3. 指定对齐值:#pragma pack (value)时的指定对齐值value。

4. 数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0".而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍)。

如何修改编译器的默认对齐值?

在缺省情况下,在vc中默认是4字节对齐的,GNU GCC也是默认4字节对齐。一般地,可以通过下面的方法来改变缺省的对界条件:

1) 使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。

2) 使用伪指令#pragma pack (),取消自定义字节对齐方式。

例子分析:

环境位(32bit、x86环境、gcc编译器)
设结构体如下定义:

#pragma pack (4) /*指定按4字节对齐(默认值)*/ 
struct A
{
       short b;
       int c;
       char a;
};

其实例在内存中的存储方式为:

C语言字节对齐(以32位系统为例)

则sizeof(A)大小等于12

 

#pragma pack (2) /*指定按2字节对齐*/
struct B
{
       char a;
       short b;
       int c;
};
#pragma pack () /*取消指定对齐,恢复缺省对齐*/

其实例在内存中的存储方式为:

C语言字节对齐(以32位系统为例)

第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合0x0000%1=0;第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中,符合0x0002%2=0。第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放
在0x0006、0x0007中,符合0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。又C的自身对齐值为4,所以C的有效对齐值为2。又8%2=0,C只占用0x0000到0x0007的八个字节。所以sizeof(struct C)=8.

字节对齐可能带来的隐患:

代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:
unsigned int i = 0x12345678;
unsigned char *p=NULL;
unsigned short *p1=NULL;

p=&i;
*p=0x00;
p1=(unsigned short *)(p+1);
*p1=0x0000;
最后两句代码,从奇数边界去访问unsignedshort型变量,显然不符合对齐的规定。
x86上,类似的操作只会影响效率,但是在MIPS或者sparc上,可能就是一个error,因为它们要求必须字节对齐.


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值