内存对齐规则:
1)对于结构体的每个成员,按照定义的顺序,第一个成员位于偏移为0的位置,之后每个数据成员的偏移量必须是min(#pragma pack(),数据成员自身长度) 的倍数。其中pragma pack()为系统指定大小,x86下的gcc通常默认为4,也可以设置为2,8,16;
2)在数据成员完成各自对齐之后,结构体本身也要进行对齐,对齐将按照min(#pragma pack(),结构体最大数据成员长度)进行,即结构体的大小总会是min(#pragma pack(),结构体最大数据成员长度)的整数倍。内存对齐的作用:
1)平台移植
一些系统对对齐要求非常严格,比如sparc系统,如果读取未对齐的数据会发生错误,系统会抛出硬件异常;
2)CPU效率
cpu读取数据并不是逐bit来读的,而是一块一块来读的,每次读的大小是按照memory access granularity(粒度)来进行,这个值也可以是2,4,8,16。
如果读取未对齐的数据,CPU将读取包含这个数据的所有块到寄存器,再去掉未对齐的头和尾,最终读入,若读入的数据已经对齐,则不需要处理即可直接读入,所以内存对齐对CPU性能有较大提高。对齐方式
1)操作系统会自动对结构体进行对齐,编译器和C库透明地帮你处理对齐问题,POSIX 标明了通过malloc( ), calloc( ), 和 realloc( ) 返回的地址对于任何的C类型来说都是对齐的
2)对于较大的内存分配,需要手动用posix_memalign进行对齐。/* one or the other -- either suffices */ #define _XOPEN_SOURCE 600 #define _GNU_SOURCE int posix_memalign (void **memptr, size_t alignment, size_t size); * See http://perens.com/FreeSoftware/ElectricFence/ and http://valgrind.org, respectively.
调用posix_memalign( )成功时会返回size字节的动态内存,并且这块内存的地址是alignment的倍数。参数alignment必须是2的幂,还是void指针的大小的倍数。返回的内存块的地址放在了memptr里面,函数返回值是0.
调用失败时,没有内存会被分配,memptr的值没有被定义,返回如下错误码之一:
- EINVAL:参数不是2的幂,或者不是void指针的倍数。
- ENOMEM:没有足够的内存去满足函数的请求.
总结
1)在定义结构体时,需要注意变量的定义顺序,因为自动的对齐会分配更多的空间struct exam { char a ; int b ; short c ; };
char占一个字节,起始偏移为0 ,int 占4个字节,起始偏移必须为4的倍数,所以起始偏移为4,在char后编译器会添加3个字节的额外字节,不存放任意数据。short占2个字节,按2字节对齐,起始偏移为8,正好是2的倍数,无须添加额外字节。
还要继续进行结构本身的对齐,对结构中最大数据成员长度为int,占4字节,而默认的#pragma pack 指定的值为4,所以结果本身按照4字节对齐,结构总大小必须为4的倍数,需添加2个额外字节使结构的总大小为12 。
而如果变量按如下定义,则只需要分配8的总大小,可以节省一定的空间:``` struct exam { short c ; char a ; int b ; };
2)如果申请了较大的内存空间,则需要手动将☞于内存页对齐,以达到良好的性能:
posix_memalign(&buffer, getpagesize(), #SIZE);
Linux下C语言的内存对齐
最新推荐文章于 2024-02-10 20:30:37 发布