C---编译器字节对齐

最新推荐文章于 2024-08-03 22:26:35 发布

火山宝 && 王林宝

最新推荐文章于 2024-08-03 22:26:35 发布

阅读量761

点赞数 2

分类专栏： C/C++ 文章标签： c语言

本文链接：https://blog.csdn.net/weixin_40401027/article/details/120747152

版权

C/C++ 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

编译器字节对齐

背景
概念
为什么要字节对齐
正确处理字节对齐
__attribute__选项
什么时候需要设置对齐
更改C编译器的缺省字节对齐方式

背景

在项目代码中碰到平台配置文件中定义结构体时使用关键词__attribute__，遂在网上查找它的相关知识，发现有好文将我的疑惑解开，在这里贴出出处字节对齐。同时为了方便日后自己查阅，下文均是摘自上文精华。如有冒犯，联系删帖。

概念

自然对齐:
对齐跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍，他就被称做自然对齐。
比如在32位cpu下，假设一个整型变量的地址为0x00000004，那它就是自然对齐的。
字节对齐:
在C语言中，结构是一种复合数据类型，其构成元素既可以是基本数据类型（如int、long、float等）的变量，也可以是一些复合数据类型（如数组、结构、联合等）的数据单元。在结构中，编译器为结构的每个成员按其自然边（alignment）分配空间。各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个结构的地址相同。为了使CPU能够对变量进行快速的访问,变量的起始地址应该具有某些特性,即所谓的”对齐”.

为什么要字节对齐

需要字节对齐的根本原因在于CPU访问数据的效率问题。
假设上面整型变量的地址不是自然对齐，比如为0x00000002，则CPU如果取它的值的话需要访问两次内存，第一次取从0x00000002-0x00000003的一个short，第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据，如果变量在0x00000003地址上的话则要访问三次内存，第一次为char，第二次为short，第三次为char，然后组合得到整型数据。
而如果变量在自然对齐位置上，则只要一次就可以取出数据。一些系统对对齐要求非常严格，比如sparc系统，如果取未对齐的数据会发生错误，举个例：
　　
　　char ch[8];
　　char *p = &ch[1];
　　int i = *(int *)p;　
　　
　　运行时会报segment error，而在x86上就不会出现错误，只是效率下降。

正确处理字节对齐

对于标准数据类型，它的地址只要是它的长度的整数倍就行了，而非标准数据类型按下面的原则对齐：
　　
　　数组：按照基本数据类型对齐，第一个对齐了后面的自然也就对齐了。
　　联合：按其包含的长度最大的数据类型对齐。
　　结构体：结构体中每个数据类型都要对齐。
　　比如有如下一个结构体：
　　
　　struct stu{
　　 char sex;
　　 int length;
　　 char name[10];
　　};
　　struct stu my_stu;
　　
　　
由于在x86下，GCC默认按4字节对齐，它会在sex后面跟name后面分别填充三个和两个字节使length和整个结构体对齐。于是我们sizeof(my_stu)会得到长度为20，而不是15.

attribute选项

我们可以按照自己设定的对齐大小来编译程序，GNU使用__attribute__选项来设置，比如我们想让刚才的结构按一字节对齐，我们可以这样定义结构体
　　
　　struct stu{
　　 char sex;
　　 int length;
　　 char name[10];
　　}attribute ((aligned (1)));
　　
　　struct stu my_stu;
　　
　　
　　则sizeof(my_stu)可以得到大小为15。
　　
　　上面的定义等同于
　　
　　struct stu{
　　 char sex;
　　 int length;
　　 char name[10];
　　}attribute ((packed));
　　struct stu my_stu;
　　
　　
attribute((packed))得变量或者结构体成员使用最小的对齐方式，即对变量是一字节对齐，对域（field）是位对齐.

什么时候需要设置对齐

1.在设计不同CPU下的通信协议;
2.编写硬件驱动程序时寄存器的结构这两个地方都需要按一字节对齐;
3.文件系统中数据存储（项目代码中使用的原因）

更改C编译器的缺省字节对齐方式

在缺省情况下，C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地，可以通过下面的方法来改变缺省的对界条件：
· 使用伪指令#pragma pack (n)，C编译器将按照n个字节对齐。
· 使用伪指令#pragma pack ()，取消自定义字节对齐方式。

另外，还有如下的一种方式：
· attribute((aligned (n)))，让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n，则按照最大成员的长度来对齐。
· attribute ((packed))，取消结构在编译过程中的优化对齐，按照实际占用字节数进行对齐。