结构体字节对齐

最新推荐文章于 2024-07-25 01:07:34 发布

这是晾衣服的地方吗

最新推荐文章于 2024-07-25 01:07:34 发布

阅读量7.5k

点赞数 4

本文链接：https://blog.csdn.net/ffghggf/article/details/86707289

版权

结构体字节对齐

http://blog.163.com/ecy_fu/blog/static/4445126200910603739941/

http://hi.baidu.com/skyland_lee/blog/item/45604bca81e1928cc91768d7.html，这篇文章比较专业地分析了字节对齐在VC和GCC的特点，写得非常不错。这两天我在为毕业设计做准备，所以要花点时间研究字节对齐的问题。

文章中有这样一段话：

Win32平台下的微软C编译器(cl.exe for 80×86)的对齐策略：

1) 结构体变量的首地址能够被其最宽基本类型成员的大小所整除；

备注：编译器在给结构体开辟空间时，首先找到结构体中最宽的基本数据类型，然后寻找内存地址能被该基本数据类型所整除的位置，作为结构体的首地址。将这个最宽的基本数据类型的大小作为上面介绍的对齐模数。

2) 结构体每个成员相对于结构体首地址的偏移量（offset）都是成员大小的整数倍，如有需要编译器会在成员之间加上填充字节（internal adding）；

备注:为结构体的一个成员开辟空间之前，编译器首先检查预开辟空间的首地址相对于结构体首地址的偏移是否是本成员的整数倍，若是，则存放本成员，反之，则在本成员和上一个成员之间填充一定的字节，以达到整数倍的要求，也就是将预开辟空间的首地址后移几个字节。

3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍，如有需要，编译器会在最末一个成员之后加上填充字节（trailing padding）。

备注：结构体总大小是包括填充字节，最后一个成员满足上面两条以外，还必须满足第三条，否则就必须在最后填充几个字节以达到本条要求。

通过一个例子来验证之，有这样一个结构体：

struct S

{

int a;

double b;

int c;

};

sizeof得到它的大小为24，显然为了满足第2)条，在a后面填充了4个字节，以保证b成员的地址相对于结构体首地址的偏移量是8的倍数；为了满足 3)条，在c的后面填充了4个字节，使得结构体的总大小为结构体最宽基本类型成员大小的整数倍。这样sizeof(S)就是24了。至于第一条，我倒是第一次看到，验证了下发现有点奇怪，测试代码如下（VS2008）：

struct S s1;

int a = 4;

struct S s2;

printf("%d, %d\n", &s1, (int)(&s1) % 8);

printf("%d, %d\n", &s2, (int)(&s2) % 8);

观察内存可知，&s1是能被8整除的，s1后面填充了好多字节，然后就是a，a后面又填充了一些字节，然后才是s2，感觉有点乱？最后发现"(int)&s2 % 8"等于4，这就不符合1)条了。

如果使用“#pragma pack(4)声明下”，这个结构体的大小就会变成16，也就是按照4字节对齐了。pack(n)用于指明对齐的最大值。

文章中对于位域结构体有这样一段话：

如果结构体中含有位域(bit-field)，那么VC中准则又要有所更改：

1) 如果相邻位域字段的类型相同，且其位宽之和小于类型的sizeof大小，则后面的字段将紧邻前一个字段存储，直到不能容纳为止；

2) 如果相邻位域字段的类型相同，但其位宽之和大于类型的sizeof大小，则后面的字段将从新的存储单元开始，其偏移量为其类型大小的整数倍；

3) 如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，VC6采取不压缩方式（不同位域字段存放在不同的位域类型字节中），Dev-C++和GCC都采取压缩方式；

用几个例子来测试一下：

struct S2

{

int a: 2;

int b: 3;

int c: 3;

};

struct S3

{

char a : 2;

int b : 3;

};

sizeof(S2)=4，满足1)条；sizeof(S3)=8，满足3)条。

同GCC的差异性。GCC最大的对齐模数为4，所以S的大小为16；S2，S3的大小为4，因为GCC会将S3中的a和b压缩在一个4字节中，VC却采用非压缩方式。

C语言结构体的字节对齐原则

http://blog.csdn.net/shenbin1430/article/details/4292463

为什么要对齐?

现代计算机中内存空间都是按照byte划分的，从理论上讲似乎对任何类型的变量的访问可以从任何地址开始，但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问，这就需要各种类型数据按照一定的规则在空间上排列，而不是顺序的一个接一个的排放，这就是对齐。

对齐的作用和原因：各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况，但是最常见的是如果不按照适合其平台要求对数据存放进行对齐，会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始，如果一个int型（假设为32位系统）如果存放在偶地址开始的地方，那么一个读周期就可以读出这32bit，而如果存放在奇地址开始的地方，就需要2个读周期，并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。

二.字节对齐对程序的影响:

先让我们看几个例子吧(32bit,x86环境,gcc编译器):

设结构体如下定义：

struct A

{

int a;

char b;

short c;

};

struct B

{

char b;

int a;

short c;

};

现在已知32位机器上各种数据类型的长度如下:

char:1(有符号无符号同)

short:2(有符号无符号同)

int:4(有符号无符号同)

long:4(有符号无符号同)

float:4 double:8

那么上面两个结构大小如何呢?

结果是:

sizeof(strcut A)值为8

sizeof(struct B)的值却是12

结构体A中包含了4字节长度的int一个，1字节长度的char一个和2字节长度的short型数据一个,B也一样;按理说A,B大小应该都是7字节。

之所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果,那么我们是不是可以改变编译器的这种默认对齐设置呢,当然可以.例如:

#pragma pack (2) /*指定按2字节对齐*/

struct C

{

char b;

int a;

short c;

};

#pragma pack () /*取消指定对齐，恢复缺省对齐*/

sizeof(struct C)值是8。

修改对齐值为1：

#pragma pack (1) /*指定按1字节对齐*/

struct D

{

char b;

int a;

short c;

};

#pragma pack () /*取消指定对齐，恢复缺省对齐*/

sizeof(struct D)值为7。

后面我们再讲解#pragma pack()的作用.

三.编译器是按照什么样的原则进行对齐的?

先让我们看四个重要的基本概念：

1.数据类型自身的对齐值：

对于char型数据，其自身对齐值为1，对于short型为2，对于int,float,double类型，其自身对齐值为4，单位字节。

2.结构体或者类的自身对齐值：其成员中自身对齐值最大的那个值。

3.指定对齐值：#pragma pack (value)时的指定对齐值value。

4.数据成员、结构体和类的有效对齐值：自身对齐值和指定对齐值中小的那个值。

有了这些值，我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值，最重要。有效对齐N，就是表示“对齐在N上”，也就是说该数据的"存放起始地址%N=0".而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放，结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍，结合下面例子理解)。这样就不能理解上面的几个例子的值了。

例子分析：

分析例子B；

struct B

{

char b;

int a;

short c;

};

假设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值，在笔者环境下，该值默认为4。第一个成员变量b的自身对齐值是1，比指定或者默认指定对齐值4小，所以其有效对齐值为1，所以其存放地址0x0000符合0x0000%1=0.第二个成员变量a，其自身对齐值为4，所以有效对齐值也为4，所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中，复核0x0004%4=0,且紧靠第一个变量。第三个变量c,自身对齐值为 2，所以有效对齐值也是2，可以存放在0x0008到0x0009这两个字节空间中，符合0x0008%2=0。所以从0x0000到0x0009存放的都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是