结构体简述
结构体是C语言中非常重要的一种自定义类型,结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
比如我们想描述一个学生,C语言中自带的类型无法完成这样的定义,那么这个时候我们就需要用到结构体。
可以这样定义:
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};//分号不能丢
通过上面的结构体,我们就可以完成对一个学生的描述。
那么结构体在内存中是如何存储的呢?
比如上面定义学生的结构体,很多人会认为它在内存中分配的字节数是1+4+1+1=7。真的是这样吗?
答案当然不是,不然也对不起它叫的谜团二字。
下面我就为大家揭晓答案。
结构体内存对齐的三重奏
在进入正题之前,我要告诉大家的是,结构体占用的第一个成员是在与结构体变量偏移量为0的地方。
假如要在A处存放结构体变量,那么第一个成员变量a就会放在A处,与结构体变量的偏移量为0,b变量在a的下方,偏移量为1,以此类推。
一重奏:确认成员变量的对齐数
对齐数指的是编译器默认的一个对齐数与该成员大小的较小值,也就是说,比较默认对齐数和成员变量占用内存的大小,小的就是对齐数。
要注意:在不同的编译器下,默认的对齐数是不同的。
VS:默认对齐数是8
Linux:默认对齐数为4
我列了一个表格,在VS和Linux下不同变量类型的对齐数
二重奏:对齐到对应类型对齐数的整数倍的地址处
这个是什么意思呢?我画图来解释一下:
以下面的结构体为例
struct S s
{
char a;
int b;
double d;
};
char类型对齐数在VS底下是1,并且a变量在最开始,放在结构体的起始位置,a的偏移量是0.
int类型对齐数是4,按照规则应该存放在4的整数倍的地址处,这个地址是相对于起始位置的地址,可以理解为偏移量为4的整数倍。
double类型的对齐数是8,应该存放在8的整数倍地址处。
对上图解释一下:
a变量在最开始,应该放在结构体开始的起始位置,占用一个字节。
b变量是int类型,对齐数是4,而a变量下面的位置偏移量是1,不是4的整数倍,因此不能存放b,要浪费3个字节。b变量要存放在偏移量为4的位置,占用4个字节。
d变量是double类型,对齐数为8,b变量下面位置偏移量为8,正好是8的整数倍,可以存放d变量,占用8个字节。
三重奏:结构体总大小为最大对齐数的整数倍
结构体大小并不是由从开始位置到结束位置的总大小决定的,而是看开始位置到结束位置的总大小是不是最大对齐数的整数倍。
最大对齐数是成员中对齐数最大的一个,比如上面的结构体,最大对齐数就是double类型的8。所以整个结构体的大小应该是8的整数倍。
上面结构体占用16个字节,正好是8的整数倍。16就是这个结构体的大小。如果占用的字节数不是最大对齐数的整数倍,就要增加到整数倍,才作为结构体的大小。
有一种特殊情况,就是如果结构体里嵌套了结构体,计算方法有一些变化:
嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
这就是结构体的内存对齐。
那么内存对齐存在的理由是什么,主要有两个:
1.平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总的来说,结构体的内存对齐就是用空间换取时间。
由于内存对齐的存在,在定义结构体的时候要尽量让占用空间小的变量集中在一起。
例如,对下面两个结构体:
struct S1
{
char a;
int b;
char c;
};
struct S2
{
char a;
char c;
int b;
};
S1的内存大小为12个字节
S2的大小为8个字节
从图中可以看出,粉红色为浪费的空间,S1明显消耗要大于S2。
只是顺序的变化就能节省4个字节,这是因为将占用空间小的变量放在一起,能够节省一些为了内存对齐浪费的空间。