c语言的内存对齐

内存对齐的问题主要存在于理解struct和union等复合结构在内存中的分布

为什么要求内存对齐?

对齐原因

大部分的参考资料都是如是说的:
1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2、性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。例如

程序:

#include <iostream>
using namespace std;
struct Test_A
{

     char a;
     char b;
     int c;
};

struct Test_B
{

     char a;
     int c;
     char b;
};

struct Test_C
{

     int c;
     char a;
     char b;
};

int main()
{
     struct Test_A a;
     memset(&a, 0, sizeof(a));
     struct Test_B b;
     memset(&b, 0, sizeof(b));
     struct Test_C c;
     memset(&c, 0, sizeof(c));
     // Print the memory size of the struct

     cout<<"a的大小:"<<sizeof(a)<<endl;
     cout<<"b的大小:"<<sizeof(b)<<endl;
     cout<<"c的大小:"<<sizeof(c)<<endl;
     return 0;

}
运行结果:

定义的三个结构体只有 成员定义的顺序不同,就出现了不同的结构体大小,为什么呢?

这就是内存对齐。为什么要有内存对齐呢?该占用多大的内存,那就开辟对应大小的内存就好了,好比上面的结构体,两个char类型和一个int类型,大小应该是6bytes才对啊,怎么又是8bytes,又是12bytes的啊?

对于内存对齐,主要是为了提高程序的性能,数据结构,特别是栈,应该尽可能地在自然边界上对齐。原因在于,为了访问未对其的内存,处理器需要做两次内存访问;然而,对齐的内存访问仅仅需要一次内存访问。

#include <stdio.h>
struct Test
{
     char a;
     int b;
     int c;
     char d;
};

 int main()
{
     struct Test structTest;
     printf("&a=%p\n", &structTest.a);
     printf("&b=%p\n", &structTest.b);
     printf("&c=%p\n", &structTest.c);
     printf("&d=%p\n", &structTest.d);
     printf("sizeof(Test)=%d\n", sizeof(structTest));
     return 0;
}


结构体Test的成员变量b占用字节数为4bytes,所以只能存储在4的整数倍的位置上,由于a只占用1一个字节,而a的地址0018ff38和b的地址0018ff3c之间相差4bytes,这就说明,a其实也占用了4个字节,这样才能保证b的起始地址是4的整数倍。这就是内存对齐。如果没有内存对齐,我们再拿上面的代码作为例子,则可能输出结果如下:

&a=0018ff38

&b=0018ff39

&c=0018ff3d

&d=0018ff41

可以看到,a占用了一个字节,紧接着a之后就是b;之前也说了,内存对齐是操作系统为了快速访问内存而采用的一种策略,简单来说,就是为了防止变量的二次访问。操作系统在访问内存时,每次读取一定的长度(这个长度就是操作系统的默认对齐系数,或者是默认对齐系数的整数倍)。没有了内存对齐,当我们读取变量c时,第一次读取0018ff3c~0018ff3f的内存,第二次读取0018ff40~0018ff43的内存,由于变量c所占用的内存跨越了两片地址区域,为了正确得到变量c的值,就需要读取两次,将两次内存合并进行整合,这样就降低了内存的访问效率

对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过 预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。
规则:
1、 数据成员对齐规则:结构(struct)(或联合(union))的 数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐 按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行
2、结构(或联合)的整体对齐规则:在 数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将 按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行
3、结合1、2可推断:当#pragma pack的n值等于或超过所有 数据成员长度的时候,这个n值的大小将不产生任何效果。
Win32平台下的 微软C 编译器( cl.exefor 80×86)的对齐策略:
1) 结构体 变量的首地址是其最长基本类型成员的整数倍;
备注: 编译器在给 结构体开辟空间时,首先找到结构体中最宽的基本 数据类型,然后寻找 内存地址能是该基本数据类型的整倍的位置,作为结构体的首地址。将这个最宽的基本 数据类型的大小作为上面介绍的对齐模数。
2) 结构体每个成员相对于结构体首地址的 偏移量(offset)都是成员大小的整数倍,如有需要 编译器会在成员之间加上填充字节(internal adding);
备注:为 结构体的一个成员开辟空间之前, 编译器首先检查预开辟空间的首地址相对于结构体首地址的偏移是否是本成员的整数倍,若是,则存放本成员,反之,则在本成员和上一个成员之间填充一定的字节,以达到整数倍的要求,也就是将预开辟空间的首地址后移几个字节。
3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要, 编译器会在最末一个成员之后加上填充字节(trailing padding)。
备注:结构体总大小是包括填充字节,最后一个成员满足上面两条以外,还必须满足第三条,否则就必须在最后填充几个字节以达到本条要求。
4) 结构体内类型相同的连续元素将在连续的空间内,和 数组一样。
5) 如果 结构体内存在长度大于处理器位数的元素,那么就以处理器的倍数为对齐单位;否则,如果结构体内的元素的长度都小于处理器的倍数的时候,便以结构体里面最长的 数据元素为对齐单位。

参考:脚本之家:http://www.jb51.net/article/56007.htm
同样写的很棒的有:http://www.cppblog.com/cc/archive/2006/08/01/10765.html
http://blog.csdn.net/hbuxiaofei/article/details/9491953

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值