为何需要内存对齐?
尽管内存以字节为单位,但是大部分处理器并不是按照字节块来存取内存的。它一般会以双字节、四字节、8字节、16字节甚至32字节为单位来存取内存,这些存储单位被称为内存存取粒度。
从Cache角度看
从上图可以看出,一个cache line保存了2^b个字节。如果没有内存对齐规则,数据可以随意存放,那么可能导致一个变量被分隔在两个cache line中,这样处理器就需要读取两行cache line然后再将其合并成一个变量。
从物理内存角度看
从上图中可以看出内存模块由8个8Mx8的DRAM组成。处理器一次从内存中读取64位的数据,给定超单元的坐标(i,j),从每个DRAM中取出对应超单元的数据,组合起来。
如果不按照内存对齐规则存取数据,可能导致的后果是,读取一个变量需要读取两次内存,因为它可能被分隔在不同坐标的超单元中。
举个例子,假如你指定获取的是0x0003-0x000a位置处的8字节数据,这时候需要从物理内存中读取出0x0000-0x0007和0x0008-0x000f两个数据,然后再进行合并。
内存对齐规则
在GCC编译器中通过预编译指令#pragma pack(n)可以改变对齐系数n,n的取值一般是1,2,4,8,16。在32位系统中默认值是4,在64位系统中默认值是8。
有效对齐值:给定#pargma pack(n)和结构体中最长数据类型中长度较小的那个,又称为对齐单位。
结构体的第一个成员的偏移量(offset)为0,之后的每个成员相对于结构体首地址的offset都是该成员大小与有效对齐值中较小的那个的整数倍,如有需要编译器会在成员之间加上填充字节。
结构体的总大小为有效对齐值的整数倍,如有需要编译器会在最后一个成员之后加上填充字节。