结构体的定义与初试化
结构体是 C 语言中的一种复合数据类型,它可以由多个不同的基本数据类型组成一个自定义的数据类型。结构体的定义使用关键字 struct,其语法如下:
struct 结构体名 {
类型 成员1;
类型 成员2;
...
类型 成员n;
};
其中,结构体名是自定义的标识符,成员可以是任意数据类型,包括基本数据类型、指针类型、数组类型以及其他结构体类型等。
在定义了结构体类型之后,我们可以创建一个或多个结构体变量来存储数据。结构体变量的创建方式与普通变量类似,只需在定义时指定结构体类型即可,例如:
struct Student {
int id;
char name[20];
float score;
};
// 创建一个结构体变量
struct Student stu1;
在定义结构体变量时,如果需要给成员变量赋初值,可以使用以下两种方式:
-
按顺序初始化
按顺序初始化指的是按照结构体定义中成员的顺序,逐一给成员变量赋值,例如:
struct Student stu1 = { 1001, "Tom", 89.5 };
-
指定成员初始化
指定成员初始化是指根据成员变量的名字,直接给某个成员变量赋值,例如:
struct Student stu1 = {
.id = 1001,
.name = "Tom",
.score = 89.5
};
结构体在内存中的对齐方式
在介绍结构体的内存对齐前,先了解一下结构体的大小。结构体的大小等于结构体中所有成员变量的大小的总和,但是由于 CPU 对内存访问有一定的规则,因此需要进行内存对齐,以保证访问内存的效率和正确性。内存对齐的规则如下:
- 结构体中每个成员变量的偏移量必须是该成员变量大小的倍数,且默认情况下,其大小必须是 2 的幂次方(如 2、4、8)。
- 结构体的大小必须是其最大成员变量的大小的倍数。
下面通过一个例子来说明内存对齐的过程。假设有如下结构体定义:
struct Test {
char m1;
int m2;
char m3;
int m4;
};
首先计算每个成员变量的大小:
- m1:1 字节
- m2:4 字节
- m3:1 字节
- m4:4 字节
由于 m2 的大小是 4 字节,因此需要在 m1 的后面填充 3 字节,使得 m2 的偏移量是 4 的倍数
m4的大小也是4 字节,需要m3后面填充3个字节
为什么存在内存对⻬?
1. 平台原因 (移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要 作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地 址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以 ⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两 个8字节内存块中。
总体来说:结构体的内存对⻬是拿空间来换取时间的做法。
综上所述,结构体是一种非常常用的数据类型,它可以将多个不同的数据类型组合成一个自定义的数据类型,方便存储和处理复杂的数据。在使用结构体时,需要注意内存对齐的问题,以保证程序的性能和正确性。