结构体
结构体的基础知识
结构是一些值的集合,这些值被称为成员变量。结构体的每个成员可以是不同类型的变量。
结构体的声明
struct tag // tag 结构体标签
{
member - list; //成员列表
}variable - list; //变量列表 注意:这里的分号不能省略
特殊的结构体声明
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], * p;
结构体自引用
struct Node
{
int data;
struct Node* next;
};
typedef struct Node
{
int data;
struct Node* next;
}Node;
结构体对齐规则
-
第一个成员在与结构体变量偏移量为0的地址处。
-
其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
linux环境下,是没有默认对齐数的,这时自身的大小就是默认对齐数 -
结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
-
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
例1:
struct S1
{
char c1;
int i;
char c2;
};
注:如下图所示,假设一个格子/单位是一个字节。
第一个结构体成员 c1 存储在与结构体变量偏移量为0的地址处。
此时结构体的其他成员变量要对齐到 对齐数 的整数倍的地址处。
i 是 int 类型,大小是 4 个字节,vs默认对齐数的值是 8,4 和 8 取其较小值,也就是 4,所以 i 需要被存储到结构体变量对应偏移量为 4 字节整数倍的地址处。
c2 是 char 类型,为 1 个字节,默认对齐数是 8,取其较小值为 1,所以 c2 需要被存储到结构体变量对应偏移量为 1 字节整数倍的地址处,这里就直接向后存储就行,因为 9 是 1 的倍数。
最后,结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
c1 的对齐数是 1
i 的对齐数是 4
c2 的对齐数是 1
取三者变量中的最大对齐数是 4 ,也就是说结构体的最终大小是 4 个字节的整数倍。这里已经使用了 0 - 8个字节,也就是9个字节,所以需要继续向后开辟空间,直到结构体变量对应偏移量为 12 字节地址处的时候,为 4 的整数倍,所以最终这个代码开辟了 12 个字节的空间。
例2:
struct S2
{
char c1; //char类型的大小是 1 字节 默认对齐数是8 1和8取其较小值 最终对齐数是1
char c2; // 同上
int i; //int 类型的大小是 4 字节 默认对齐数是8 4和8取其较小值 最终对齐数是4
};
注:c1被存储在与结构体变量偏移量为0的地址处。
c2被存储与在结构体变量对应偏移量为 1 字节整数倍的地址处。
i 被存储与在结构体变量对应偏移量为 4 字节整数倍的地址处。
最后,结构体总大小为最大对齐数 4 整数倍的地址处,0 - 7 使用了 8 个字节的空间。
练习:
struct S3
{
double d;
char c;
int i;
};
例3:结构体内嵌套结构体的情况
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3;
double d;
};
这里就用到了结构体对齐规则的第四条:
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处
(解释一下这句话就是,s3 是嵌套的结构体,它内部最大的对齐数是 8,因为 d 的对齐数是 8,c 的对齐数是 1,i 的对齐数是 4,取其最大的对齐数,那么 s3 的对齐数就是 8,此时vs默认对齐数是8 ,两者取其较小值,所以 s3 这个变量最终被存储在偏移量为 8 字节整数倍的地址处)。
结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
如图所示:
具体我们可以验证一下:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
printf("%d\n", sizeof(struct S3));
printf("%d\n", sizeof(struct S4));
return 0;
}
输出的结果是:
我们还可以通过库函数 offsetof 验证一下,就拿 s3 举例:
注:
offestof : 计算结构体成员相对于起始位置的偏移量
返回类型是 size_t
头文件:<stddef.h>
为什么存在内存对齐?
大部分的参考资料都是如是说的:
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
如图:
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起
//例如:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
修改默认对齐数
这里也可以通过 #pragma 这个预处理指令,改变我们的默认对齐数。
以上仅供参考,如有错误请多指教,谢谢。