【内存】内存对齐的原理

最新推荐文章于 2024-09-26 00:41:29 发布

bandaoyu

最新推荐文章于 2024-09-26 00:41:29 发布

阅读量2.1k

点赞数

分类专栏： C/C++

本文链接：https://blog.csdn.net/bandaoyu/article/details/107693985

版权

C/C++ 专栏收录该内容

206 篇文章 83 订阅

订阅专栏

本文深入探讨了内存对齐的两大核心原因：平台限制与性能优化。详细解析了内存由chip构成，每个chip由8个bank组成，及bank内部的电容行列矩阵结构。阐述了内存对齐如何提升内存IO效率，避免处理器多次访问未对齐内存，以及操作系统如何利用缓存优化内存访问。

摘要由CSDN通过智能技术生成

内存对齐的原因

内存对齐的原理

内存对齐的原因

1.平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2.性能原因：

内存对齐最最底层的原因是内存的IO是以64bit为单位进行的，因此内存对齐为了高效的内存IO，大部分都是更为高效的高速缓存IO。

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。你int如果从0地址开始就一次读取就够了，如果你从1地址开始，那么要读2次。

内存对齐的原理

前面我们说过内存是由chip构成。每个chip内部，是由8个bank组成的。其构造如下图：

图2.内存颗粒物理结构

在每个bank内部，就是电容的行列矩阵结构了。（注意，二维矩阵中的一个元素一般存储着8个bit，也就是说包含了8个小电容）。

图3.bank物理结构

8个同位置的元素，一起组成在内存中连续的64个bit。如下图

图4.jpg

内存在进行IO的时候，一次操作取的就是64个bit。
所以，内存对齐最最底层的原因是内存的IO是以64bit为单位进行的。 对于64位数据宽度的内存，假如cpu也是64位的cpu（现在的计算机基本都是这样的），每次内存IO获取数据都是从同行同列的8个chip中各自读取一个字节拼起来的。从内存的0地址开始，0-63bit的数据可以一次IO读取出来，64-127bit的数据也可以一次读取出来。CPU和内存IO的硬件限制导致没办法一次跨在两个数据宽度中间进行IO。
假如对于一个c的程序员，如果把一个bigint（64位）地址写到的0x0001开始，而不是0x0000开始，那么数据并没有存在同一行列地址上。因此cpu必须得让内存工作两次才能取到完整的数据。效率自然就很低。这下你有没有彻底理解了内存对齐？