关闭

很容易让人困惑的对齐原则详解

标签: 编译器数据结构structalignmentgeneration平台
294人阅读 评论(0) 收藏 举报

. 什么是字节对齐 , 为什么要对齐 ?

    
现代计算机中内存空间都是按照 byte 划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
    
对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的 CPU 在访问 一个没有进行对齐的变量的时候会发生错误 , 那么在这种架构下编程必须保证字节对齐 . 其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对 数据存放进行对齐,会在存取效率上带来损失。比如 有些平台每次读都是从偶地址开始 ,如果一个 int 型(假设为 32 位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这 32bit ,而如果存放在奇地址开始的地方,就需要 2 个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该 32bit 数据。显然在读取效率上下降很多。

. 字节对齐对程序的影响 :
先让我们看几个例子吧 (32bit,x86 环境 ,gcc 编译器 ):
设结构体如下定义:
struct A
{
     int    a;
     char b;
     short c;
};

           4Byte
         |---------|
         |     a     |
         |
-- -- |----|
         |
b - | c - |
         |
-- -- -----|


struct B
{
     char b;
     int    a;
     short c;
};

         |
-- ------|
         |
b         |
         |
-- ------|
         |     a    |
         |
---- ---- |
         |
c        |
         |
---- ---- |

现在已知 32 位机器上各种数据类型的长度如下 :
char:1     (
有符号无符号同 )    
short:2     (
有符号无符号同 )    
int:4         (
有符号无符号同 )    
long:4     (
有符号无符号同 )    
float:4     double:8
那么上面两个结构大小如何呢 ?
结果是 :
sizeof(strcut A)
值为 8
sizeof(struct B)
的值却是 12

结构体 A 中包含了 4 字节长度的 int 一个, 1 字节长度的 char 一个和 2 字节长度的 short 型数据一个 ,B 也一样 ; 按理说 A,B 大小应该都是 7 字节。之 所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果 , 那么我们是不是可以改变编译器的这种默认对齐 设置呢 , 当然可以 . 例如 :

#pragma pack (2) /*
指定按 2 字节对齐 */
struct B
{
     char b;
     int    a;
     short c;
};
#pragma pack () /*
取消指定对齐,恢复缺省对齐 */
sizeof(struct B)
值是 8


修改对齐值为 1
#pragma pack (1) /*
指定按 1 字节对齐 */
struct B
{
     char b;
     int    a;
     short c;
};
#pragma pack () /*
取消指定对齐,恢复缺省对齐 */
sizeof(struct B)
值为 7

后面我们再讲解 #pragma pack() 的作用 .

. 编译器是按照什么样的原则进行对齐的 ?

先让我们看四个重要的基本概念:
1.
数据类型自身的对齐值 :对于 char 型数据,其自身对齐值为 1 ,对于 short 型为 2 ,对于 int,float,double 类型,其自身对齐值为 4 ,单位字节。
2.
结构体的自身对齐值 :其成员中自身对齐值最大的那个值。
3.
指定对齐值: #pragma pack (value) 时的指定对齐值 value
4.
数据成员和结构体的有效对齐值: 数据成员 ( 数据类型 ) 数据结构 的自身对齐值和指定对齐值中小的那个值。 ( 数据成员对齐了数据结构自然也就对齐了 )

有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值 N 是最终用来决定数据存放地址方式的值,最重要。 有效对齐 N ,就是表示 对齐在 N ,也就是说该数据的 " 存放起始地址 %N=0". 数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据 自身的有效对齐值圆整 ( 就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍,结合下面例子理解 ) 。这样就不难理解上面的几个例子的值了。

例子分析:
分析例子 B
struct B
{
     char b;
     int    a;
     short c;
};
假设 B 从地址空间 0x0000 开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为 4 。第一个成员变量 b 的自身对齐值是 1 ,比指定或者默认指 定对齐值 4 小,所以其有效对齐值为 1 ,所以其存放地址 0x0000 符合 0x0000%1=0. 第二个成员变量 a ,其自身对齐值为 4 ,所以有效对齐值也为 4 ,所以只能存放在起始地址为 0x0004 0x0007 这四个连续的字节空间中,复核 0x0004%4=0, 且紧靠第一个变量。第三个变量 c, 自身对齐 值为 2 ,所以有效对齐值也是 2 ,可以存放在 0x0008 0x0009 这两个字节空间中,符合 0x0008%2=0 。所以从 0x0000 0x0009 存放的 都是 B 内容。再看数据结构 B 的自身对齐值为其变量中最大对齐值 ( 这里是 b )所以就是 4 ,所以结构体的有效对齐值也是 4 。根据结构体圆整的要求, 0x0009 0x0000=10 字节,( 10 2 )% 4 0 。所以 0x0000A 0x000B 也为结构体 B 所占用。故 B 0x0000 0x000B 共有 12 个字节 ,sizeof(struct B)=12; 其实如果就这一个就来说它已将满足字节对齐了 , 因为它的起始地址是 0, 因此肯定是对齐的 , 之所以在后面补充 2 个字节 , 是因为编译器为了实现结构数组的存取效率 , 试想如果我们定义了一个结构 B 的数组 , 么第一个结构起始地址是 0 没有问题 , 但是第二个结构呢 ? 按照数组的定义 , 数组中所有元素都是紧挨着的 , 如果我们不把结构的大小补充为 4 的整数倍 , 那么下一 个结构的起始地址将是 0x0000A, 这显然不能满足结构的地址对齐了 , 因此我们要把结构补充成有效对齐大小的整数倍 . 其实诸如 : 对于 char 型数据,其 自身对齐值为 1 ,对于 short 型为 2 ,对于 int,float,double 类型,其自身对齐值为 4 ,这些已有类型的自身对齐值也是基于数组考虑的 , 是因为这些类型的长度已知了 , 所以他们的自身对齐值也就已知了 .
同理 , 分析上面例子 C
#pragma pack (2) /*
指定按 2 字节对齐 */
struct C
{
     char b;
     int    a;
     short c;
};
#pragma pack () /*
取消指定对齐,恢复缺省对齐 */
第一个变量 b 的自身对齐值为 1 ,指定对齐值为 2 ,所以,其有效对齐值为 1 ,假设 C 0x0000 开始,那么 b 存放在 0x0000 ,符合 0x0000%1= 0; 第二个变量,自身对齐值为 4 ,指定对齐值为 2 ,所以有效对齐值为 2 ,所以顺序存放在 0x0002 0x0003 0x0004 0x0005 四个连续 字节中,符合 0x0002%2=0 。第三个变量 c 的自身对齐值为 2 ,所以有效对齐值为 2 ,顺序存放
0x0006 0x0007 中,符合 0x0006%2=0 。所以从 0x0000 0x00007 共八字节存放的是 C 的变量。又 C 的自身对齐值为 4 ,所以 C 的有效对齐值为 2 。又 8%2=0,C 只占用 0x0000 0x0007 的八个字节。所以 sizeof(struct C)=8.


. 如何修改编译器的默认对齐值 ?
1.
VC IDE 中,可以这样修改: [Project]|[Settings],c/c++ 选项卡 Category Code Generation 选项的 Struct Member Alignment 中修改,默认是 8 字节。
2.
在编码时,可以这样动态修改: #pragma pack . 注意 : pragma 而不是 progma.

---------------------------------------------------------

· 使用伪指令 #pragma pack (n) C 编译器将按照 n 个字节对齐
·
使用伪指令 #pragma pack () ,取消自定义字节对齐方式。

---------------------------------------------------------
· __attribute((aligned (n)))
,让所作用的结构成员对齐在 n 字节自然边界上。 如果结构中有成员的长度大于 n ,则按照最大成员的长度来对齐。
· __attribute__ ((packed))
,取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。


. 针对字节对齐 , 我们在编程中如何考虑 ?
    
如果在编程的时候要考虑节约空间的话 , 那么我们只需要假定结构的首地址是 0, 然后各个变量按照上面的原则进行排列即可 , 基本的原则就是把结构中的变量按照类型大小从小到大声明 , 尽量减少中间的填补空间 . 还有一种就是为了以空间换取时间的效率 , 我们显示的进行填补空间进行对齐 , 比如 : 有一种使用空间换时间做法是显式的插入 reserved 成员:
          struct A{
            char a;
            char reserved[3];//
使用空间换时间
            int b;
          }

reserved
成员对我们的程序没有什么意义 , 它只是起到填补空间以达到字节对齐的目的 , 当然即使不加这个成员通常编译器也会给我们自动填补对齐 , 我们自己加上它只是起到显式的提醒作用 .


. 字节对齐可能带来的隐患 :
    
代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:
unsigned int i = 0x12345678;
unsigned char *p=NULL;
unsigned short *p1=NULL;

p=&i;
*p=0x00;
p1=(unsigned short *)(p+1);
*p1=0x0000;
最后两句代码,从奇数边界去访问 unsigned short 型变量,显然不符合对齐的规定。在 x86 上,类似的操作只会影响效率,但是在 MIPS 或者 sparc 上,可能就是一个 error, 因为它们要求必须字节对齐 .

. 如何查找与字节对齐方面的问题 :
如果出现对齐或者赋值问题首先查看
1.
编译器的 big little 端设置
2.
看这种体系本身是否支持非对齐访问
3.
如果支持看设置了对齐与否 , 如果没有则看访问时需要加某些特殊的修饰来标志其特殊访问操作

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:33126次
    • 积分:513
    • 等级:
    • 排名:千里之外
    • 原创:13篇
    • 转载:53篇
    • 译文:0篇
    • 评论:2条
    文章分类
    最新评论