内存对齐，提高寻址效率

最新推荐文章于 2023-08-02 16:04:35 发布

JayerZhou

最新推荐文章于 2023-08-02 16:04:35 发布

阅读量621

点赞数 2

分类专栏：内存 C语言文章标签：内存结构

本文链接：https://blog.csdn.net/qq_37655329/article/details/121214900

版权

内存同时被 2 个专栏收录

17 篇文章 3 订阅

订阅专栏

C语言

16 篇文章 7 订阅

订阅专栏

内存对齐，提高寻址效率

计算机内存是以字节（Byte）为单位划分的，理论上CPU可以访问任意编号的字节，但实际情况并非如此。

CPU通过地址总线来访问内存，一次能处理几个字节的数据，就命令地址总线读取几个字节的数据。例如，32位的CPU一次能处理4个字节的数据，那么每次就从内存读取4个字节的数据。少了浪费主频，多了也没有用。64位的处理器也是这个道理，每次读取8个字节。

以32位CPU位例，实际寻址的步长为4个字节，也就是只对编号为4的倍数内存寻址，例如0、4、8、12、1000等，而不会对编号1、3、11、1001的内存寻址。如下图：

在这里插入图片描述

这样做可以以最快的速度寻址，不遗漏一个字节，也不重复对一个字节寻址。

对于程序来说，一个变量最好位于一个寻址步长的范围内，这样就可以一次性读取到变量的值；如果跨步长存储，就需要读取两次，然后再拼接数据，效率显然降低了。

例如一个int类型的数据，如果地址为8，那么只需要对编号为8的内存寻址一次就可以。如果编号为10，就比较麻烦，CPU需要先对编号为8的内存寻址，读取4个字节，得到该数据的前半部分，然后再对编号为12的内存寻址，读取四个字节，得到该数据的后半部分，再将两个部分的数据拼接起来，才能取得数据的值。

将一个数据尽量放在一个步长之内，避免跨步长存储，这称为内存对齐。在32位编译模式下，默认以4字节对齐；在64位编译模式下，默认以8字节对齐。

为了提高存取效率，编译器会自动进行内存对齐，请看代码：

#include <stdio.h>
#include <stdlib.h>

struct{
    int a;
    char b;
    int c;
}t={ 10, 'C', 20};

int main(){
    printf("Length: %d\h",sizeof(t));
    printf("&a: %X\n&b: %X\n&c: %X\n",&t.a, &t.b, &t.c)
    
    system("pause");
    
    return 0;
}

在32位编译模式下的运行结果：

length: 12
&a: B69030
&b: B69034
&c: B69038

如果不考虑内存对齐，结构体变量t所占的内存应该为4+1+4 = 9个字节。考虑到内存对齐，虽然成员b只占用了1个字节，但他所在的寻址步长内还剩下3个字节的空间，放不下一个int型的变量了，所以要把成员c放到下一个寻址步长。剩下的这3个字节，作为内存填充浪费掉了。请看示意图：

在这里插入图片描述

编译器之所以要内存对齐，是为了更加高效的存取成员c，而代价就是浪费了3个字节的空间。

再看一个例子：

#include <stdio.h>
#include <stdlib.h>

struct{
    int a;
    char b;
    char d;
    int c;
}t={ 10, 'C', 20};

int main(){
    printf("Length: %d\h",sizeof(t));
    printf("&a: %X\n&b: %X\n&d: %X\n&c: %X\n",&t.a, &t.b,&t.d,&t.c)
    
    system("pause");
    
    return 0;
}

在32位编译模式下的运行结果：

length: 12
&a: B69030
&b: B69034
&d: B69034
&c: B69038

可以看到总长度还是12，由于d变量与b变量的长度加起来没有超过一个步长，所以他们被放在了一个步长内，并且寻址的起点都是一样的。

除了结构体，变量也会进行内存对齐，如下：

#include <stdio.h>
#include <stdlib.h>

int m;
char c;
int n;

int main(){
    printf("&m: %X\n&c: %X\n&n: %X\n", &m, &c, &n);
    system("pause");
    return 0;
}

VS运行结果：

&m: DE3384
&c: DE338C
&n: DE3388

可见他们的地址都是4的整数倍，并相互挨着。

经过测试，对于全局变量，GCC在Debug和Release模式下都会进行内存对齐，而VS只有在Release模式下才会进行对齐。而对于局部变量，GCC和VS都不会进行内存对齐，无论是Debug还是Release模式。

改变对齐方式

内存对齐虽然和硬件有关，但是决定对齐方式的是编译器，如果你的硬件是64位的，却以32位方式编译，那么还是会按照4个字节对齐。

对齐方式可以通过编译器参数修改，以VS2010为例，更改对齐方式的步骤为：项目 --> 属性 --> C/C++ -->代码生成 --> 结构成员对齐，如图：

在这里插入图片描述

最后需要说明的是：内存对齐不是某某语言（C、C++等）的特性，他属于计算机运行原理，Java、Python等其他编程语言同样也会有内存对齐问题。

JayerZhou

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
内存对齐，提高寻址效率

内存对齐，提高寻址效率计算机内存是以字节（Byte）为单位划分的，理论上CPU可以访问任意编号的字节，但实际情况并非如此。CPU通过地址总线来访问内存，一次能处理几个字节的数据，就命令地址总线读取几个字节的数据。例如，32位的CPU一次能处理4个字节的数据，那么每次就从内存读取4个字节的数据。少了浪费主频，多了也没有用。64位的处理器也是这个道理，每次读取8个字节。以32位CPU位例，实际寻址的步长为4个字节，也就是只对编号为4的倍数内存寻址，例如0、4、8、12、1000等，而不会对编号1、3、11
复制链接

扫一扫