对字节对齐的一些理解和记录
前言(本文章来源于作者:守望先生,公众号【编程珠玑】)
1、什么是字节对齐
2、什么是字节准则
3、对齐准则是什么
4、为什么要字节对齐
5、字节对齐对编程有什么用
**######字节对齐概念#########**
字节是计算机中内存大小的基本单位。理论上,可以任意地址访问某种基本数据类型,而实际上,计算机并非逐字节大小读取内存,*是以2,4或者8的倍数的字节块来读取内存*,所以对基本数据类型的合法地址作出一些限制,即它的地址必须是2,4或8的倍数。要求各种数据类型按照一定规则在空间上排列。此为对齐
对齐准则
- 结构体变量的首地址能够被其对齐字数大小所整除
- 结构体每个成员相对结构体首地址的偏移都是成员大小的整数倍 如不满足,对前一个成员填充字节以满足。
- 结构体的总大小为结构体对齐字节数大小的整数倍 如不满足,最后填充字节以满足
#include<stdio.h`>
#include<stdint.h>
struct test
{
int a;
char b;
int c;
short d;
}
int main(int argc,char*argv)
{
// 在32位和64位的机器上,size_t大小不同
printf("the size of struct test is %zu\n",sizeof(struct test));
return 0;
}
编译成32位程序并运行(默认四字节自然对齐),可以看到,结构体test的大小为16字节,而不是11字节(a占4字节,b占1字节,c占4个字节,d占2字节)
#64位机器上编译32需要安装一个库
#sudo apt-get install gcc-multilib
gcc -m32 -o testByteAlign testByteAlign.c #编译程序
chmod +x testByteAlign #赋执行权限
./testByteAlign #运行
the size of struct test is 16
实际上,结构体test的成员在内存中可能是像下面这样分布的(数值为偏移量)
未对齐时:
|0~3| 4 | 5~9 | 10~11 |
|a | b | c | d |
对齐时:
|0~3| 4 | 5~7 | 8~11 | 12~13 | 14~15 |
|a | b | 填充内容 | c | d |填充内容|
从上面可以看出,c的偏移为5,不满足对齐要求(它的偏移量应该能够被sizeof(int)大小整除),因此在b后面增添了3个字节,使得c的偏移为8。在b后面填充侯,d已经满足对齐要求了。但是还需要填充后面字节的内容,(why,满足第三条准则 )
****考虑以下的声明****
struct teArray[2];
不难知道,teArrat[0]的d如果不填充字节,那么teArray[1]的a偏移为14,不满足对齐要求,因此d后面也需要填充字节。
为什么要字节对齐
无论数据是否对齐,大多是计算机都可以正确工作,而且从前面可以看到,结构体test本来只需要11字节的空间,最后却占用了16字节,很明显浪费了空间,那么为什么还要进行字节对齐呢?最重要的是提高内存系统性能。
前面提过,计算机每次读写一个字节快,例如:假如计算机总是从内存中取8个字节,如果一个double数据的地址对齐成8的倍数,那么一个内存操作就可以读或者写,但是如果这个double数据的地址没有对齐,数据就可能被放在两个8字节块中,那么我们可能需要执行两次内存访问,才能读写完成。显然在这个情况下,是低效的
**所以需要字节对齐来提高内存系统性能。**
在有些处理器中,如果需要未对齐的数据,可能不能够正确工作甚至冲突(crash),这里不多言。
实际编程中的考虑
实际上,字节对齐的细节都由编译器来完成,我们不需要特意进行字节对齐,但是这并不意味着我们不需要关注字节对齐的问题
##空间存储
还是以前面的结构体test为例,其占用空间大小为16字节,但是如果我们换一种声明方式,调整变量的顺序,重新运行程序,最后发现结构体test占用大小为12字节
struct test
{
int a;
char b;
short d;
int c;
}
空间存储情况如下,b和c存储在了一个字节块中
| 0~3 | 4 | 5 | 6~7 | 8~11 |
|a | b | 填充内容 | c | d |
也就是说,如果我们在设计结构的时候,合理调整成员的位置,可以大大节省存储空间
跨平台通信
由于不同平台的对齐方式不同,所以,同样的结构在不同的平台其大小可能不同,在无意识的情况下,互相发送的数据可能出现错乱,甚至引发严重的问题。因此,为了不同处理器之间能够正确的处理消息,我们有以下两种可选的处理方法、
- 1字节对齐
- 自己对结构进行字节填充
我们可以使用伪指令#pragma pack(n)(n为字节对齐数)来使得结构间一字节对齐。同样,如果在结构体test的前面加上伪指令,如下:
#pragma pack(1) /* 1字节对齐 */
struct test
{
int a;
char b;
int c;
short b;
}
#pragma pack() /*还原默认对齐*/
在这样的声明下,任何平台结构体test的大小都为11字节,这样做能够保证跨平台的结构大小一直,同时还节省了空间,但是效率降低了。
当然了对于单个结构体,gcc还有如下的方法,使其1字节对齐
struct test
{
int a;
char b;
int c;
short b;
}_attribute_((packed));
注:
- attribute__((aligned(n))),让所作用的结构成员对齐在n字节自然边界上,如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。
- _attribute((packed))取消结构在编译过程中的优化对齐,也可以认为是1字节对齐。
除了前面的1字节对齐,还可以进行人为的填充,即test结构体声明如下
struct test
{
int a;
char b;
char reserve[3];
int c;
short d;
char reserve1[2];
};
访问效率高,但是不节省空间,同时扩展性不是很好。例如,当字节对齐有变化时,需要填充的字节数可能就会发生变化。
总结
虽然我们不需要具体关心字节对齐的细节,但是如果不关注字节对齐的问题,可能会在编程中遇到难以理解或解决的问题。因此 针对字节对齐,总结了以下处理建议:
- 结构体成员合理安排位置,以节省空间
- 跨平台数据结构可考虑1字节对齐,节省空间但影响访问效率
- 跨平台数据结构人为进行字节填充,提高访问效率但不节省空间
- 本地数据采用默认对齐,以提高范文效率