字节对齐

最新推荐文章于 2023-08-05 15:13:16 发布

迷你球

最新推荐文章于 2023-08-05 15:13:16 发布

阅读量389

点赞数

文章标签： c语言字节对齐

本文链接：https://blog.csdn.net/u010456460/article/details/54316287

版权

一、什么是字节对齐

现代计算机中，内存空间按照字节划分，理论上可以从任何起始地址访问任意类型的变量。但实际中在访问

特定类型变量时经常在特定的内存地址访问，这就需要各种类型数据按照一定的规则在空间上排列，而不是

顺序一个接一个地存放，这就是对齐。

二、为什么需要字节对齐

这就涉及到CPU获取数据的效率的问题了。对于普遍的32位芯片来说，CPU从内存中获取数据时，每次访问的内存地址一定

是4的倍数（32位，4个字节），如0x00000000,0x00000004,0x00000008...如果不进行字节对齐，那么就会存在CPU在访问

内存中一个2字节大小或者4字节大小的数据时，需要访问两次才能把数据完整读取出来的可能。如果在编译的时候，通过

#pragma pack (1)的方式设定为有效对齐字节数为1，那么当该2字节大小的数据存放在0x00000003时，就会导致出现跨区的

现象（跨区是指一个数据在内存中的存储跨越了两个“CPU的访问区”，如0x00000000为CPU的一个访问区，0x00000004也是），

这时，由于该数据储存在内存中0x00000003~0x00000004这段区间上，如果CPU想要访问该数据，那么就得分两次访问去获取到

该数据，CPU第一次访问0x00000000~0x00000003这段区域，获取到存储在0x00000003上该数据的低八位，接着CPU再访问一次内

存，第二次访问的是0x00000004~0x00000007这段区域，获取到存储在0x00000004上该数据的高八位，然后CPU在缓存上把两次

访问到的结果进行组合，得到该数据，再将其放到寄存器中。而如果编译器对内存进行了默认的字节数对齐（32位的机器上位

4个字节），那么就不会出现两个字节或者4个字节大小的数据存放在奇数的内存地址上。这样CPU在访问该数据时，就可以一次

性获取到数据内容，提高了效率。

三、如何分辨结构体类的变量的字节对齐

之所以会牵扯到字节对齐这个问题，还是由于一个结构体相关的问题引起的，现在就以结构体为例，总结下字节对齐。

struct A{
    int    a;
    char   b;
    short c;
};
struct B{
    char   b;
    int    a;
    short c;
};

以上有两个结构体类型的定义，两个结构体的成员一样，只不过在结构体中的定义顺序不一样，那么这两个结构体的大小分别

多大呢？

结果表示，sizeof(struct A) = 8，而sizeof(struct B) = 12。为什么会这样呢？下面就来好好分析下。

在我看来，字节对齐需要遵从以下两个原则（假设编译器默认的字节对齐数为4）：

①设所要存储的数据大小为n字节，所要存储的内存地址为M，则需满足M%n = 0；

②结构体的最终字节大小一定是结构体成员中对齐字节数最大的倍数；

下面就这两个原则对上面两个结构体A和B进行分析：

结构体A：该结构体有三个成员，分别是int(4),char(1),short(2),括号内的数字表示该成员的有效字节对齐数。

假设结构体的起始地址为0x00000000,该结构体的第一个成员为int，字节数为4，满足M%n = 0的原则，可以存放该成员；

该结构体的第二个成员为char，字节数为1，存储地址为0x00000004，满足满足M%n = 0的原则，可以存放该成员；

该结构体的第三个成员为short，字节数为2，存储地址为0x00000005，并不满足M%n = 0的原则，则存储地址需往后挪一个字节，

存储地址变为0x0000006，可以满足M%n = 0的原则，最终该结构体在内存中存储区域为0x00000000~0x00000007，共8个字节大小，

且8为4的倍数（该结构体成员中最大字节数为4），满足第二个原则，故该结构体大小为8个字节。

结构体B：该结构体有三个成员，分别是char(1),int(4),short(2),括号内的数字表示该成员的有效字节对齐数。

假设结构体的起始地址为0x00000000,该结构体的第一个成员为char，字节数为1，满足M%n = 0的原则，可以存放该成员；

该结构体的第二个成员为int，字节数为4，存储地址为0x00000001，并不满足满足M%n = 0的原则，不可以存放该成员，存储

地址需要往后挪，直至挪到0x00000004，才能被4整除；

该结构体的第三个成员为short，字节数为2，存储地址为0x00000008，满足M%n = 0的原则，可以存放该成员；

最终该结构体在内存中存储区域为0x00000000~0x00000009，共10个字节大小，但由于10不是4的倍数，所以需要为该结构体填充

两个字节大小的空数据的区间，此时该结构体在内存中存储区域为0x00000000~0x000000011，共12字节大小，且12为4的倍数（该

结构体成员中最大字节数为4），满足第二个原则，故该结构体大小为12个字节。

四、如何在编译阶段改变变量的有效字节对齐数

字节对齐，提高了CPU的访问效率，但也浪费了内存空间。那如果不想数据在内存中按默认的字节对齐，想自己定义字节对齐数，

该怎么做呢？

可以在代码中添加#pragma pack (n)和#pragma pack ()来达到目的，其中n为设置的字节对齐数。以下设置为1字节对齐：

#pragma pack (1) /*指定按1字节对齐*/
struct D {
    char b;
    int a;
    short c;
};
#pragma pack ()/*取消指定对齐，恢复缺省对齐*/

这样子，内存存储该结构体D时，就会按照指定1字节对齐了。

迷你球

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
字节对齐

一、什么是字节对齐现代计算机中，内存空间按照字节划分，理论上可以从任何起始地址访问任意类型的变量。但实际中在访问特定类型变量时经常在特定的内存地址访问，这就需要各种类型数据按照一定的规则在空间上排列，而不是顺序一个接一个地存放，这就是对齐。二、为什么需要字节对齐这就涉及到CPU获取数据的效率的问题了。对于普遍的32位芯片来说，CPU从内存中获取数据时，每次访
复制链接

扫一扫