C语言结构体详解
- 结构体的声明创建与初始化
#include<stdio.h>
struct Stu
{
char name[10];
int age;
}s1, s2;
struct Stu s3;
//结构体变量s1 s2 s3均为全局变量
int main()
{
//s4 s5均为局部变量
struct Stu s4 = { "cat",20 };//结构体变量按照顺序初始化
struct Stu s5 = { .age = 100,.name = "dog" };//结构体变量按照指定顺序初始化
printf("%s\n", s4.name);
printf("%d\n", s5.age);
return 0;
}
输出结果:
cat
100
- 结构体的特殊声明
//匿名结构体
struct
{
char name[10];
int age;
}s1 = { "pig",100 };;//只能在这里创建变量名和初始化
struct
{
float price;
char name[10];
}*p;
int main()
{
p = &s1;//该语句不合法
printf("%s %d", s1.name, s1.age);//该语句合法,正常输出
return 0;
}
注意:上面的两个结构在声明的时候省略掉了结构体标签。
解释:编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
- 结构体的自引用
例如:在结构中包含一个类型为该结构本身的成员
//错误案例展示
#include<stdio.h>
struct Node
{
int data;
struct Node next;
}N1;
int main()
{
printf("%zd", sizeof(N1));
return 0;
}
通过分析可知,由于不断地嵌套结构体,这样的输出结果应该是无限大的。
正确的自引用:
struct Node
{
int data;
struct Node* next;
}N1;
int main()
{
printf("%zd", sizeof(N1));
return 0;
}
输出结果:8
- 结构体内存对齐
-
对齐规则:
- 结构体的第⼀个成员对齐到和结构体变量起始位置偏移量为0的地址处,其他成员变量要对齐到对齐数的整数倍的地址处。
- 对齐数 = min { 编译器默认对齐数,该成员变量的大小 }
- VS2022中默认的对齐数为8,在Linux下的gcc中没有默认对齐数,对齐数就是成员自身的大小。
- 结构体的总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,选取所有对齐数中最大的)的整数倍。
- 如果是嵌套了结构体的情况,嵌套的结构体成员对齐到自己成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(包括嵌套结构体中成员的对齐数)的整数倍。
-
练习:
#include<stdio.h> //练习一 struct S1 { char c1; int i; char c2; }; //练习二 struct S2 { char c1; char c2; int i; }; //练习三 struct S3 { double d; char c; int i; }; //练习四:结构体嵌套问题 struct S4 { char c1; struct S3 s3; double d; }; int main() { printf("%zd\n", sizeof(struct S1)); printf("%zd\n", sizeof(struct S2)); printf("%zd\n", sizeof(struct S3)); printf("%zd\n", sizeof(struct S4)); return 0; }
输出结果:12 8 16 32
-
题目解析:
练习一:第一个char类型先对齐第0个字节,占据0号字节。第二个int类型的对齐数为4,对齐到4的整数倍,占据第4 5 6 7号字节。第三个char类型的对齐数为1,占据第8号字节。由于该结构体成员的最大对齐数为4,总大小要找4的倍数,也就是12。其中1 2 3 9 10 11号字节被浪费了。
练习二:第一个char类型先对齐第0个字节,占据0号字节。第二个char类型对齐数为1,占据第1号字节。第三个int类型对齐数为4,占据第4 5 6 7号字节。由于该结构体成员的最大对齐数为4,总大小要找4的倍数,也就是8。其中2 3号字节被浪费了。
练习三:第一个double类型先对齐第0个字节,占据0 1 2 3 4 5 6 7号字节。第二个char类型对齐数为1,占据第8号字节。
第三个int类型的对齐数是4,占据第12 13 14 15号字节。由于该结构体成员的最大对齐数为8,总大小要找8的倍数,也就是16。其中9 10 11号字节被浪费了。练习四:第一个char类型先对齐第0个字节,占据0号字节。第二个为嵌套结构体,该结构体的大小为16,其中成员的最大对齐数是8,占据8 9 10 … 20 21 22 23号字节,第三个double类型对齐数为8,占据24 25 26 27 28 29 30 31号字节。由于该结构体成员的最大对齐数为8,总大小要找8的倍数,也就是32。其中1 2 3 4 5 6 7号字节被浪费了。
-
-
内存对齐的原因
- 平台原因: 部分硬件平台只能在某些地址处取某些特定类型的数据
- 性能原因:访问未对齐的内存,处理器需要做出两次内存访问,而对齐的内存访问仅需要一次访问。假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一次内存操作来读取数值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
- 总体来说:结构体的内存对齐是一种拿空间来换取时间的做法。
-
那么在设计结构体时,我们应当让占内存空间较小的成员尽量集中在一起,以节省空间。
#include<stdio.h>
struct s1
{
char c1;
char c2;
int a;
double b;
};
struct s2
{
double b;
char c1;
int a;
char c2;
};
int main()
{
printf("%zd\n", sizeof(struct s1));
printf("%zd\n", sizeof(struct s2));
return 0;
}
其中s1的大小为16B,而s2的大小为24B。
- 修改默认对齐数
我们可以使用#pragma这个预处理指令,来修改默认对齐数
#include<stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
struct S2
{
char c1;
int i;
char c2;
};
int main()
{
printf("%zd\n", sizeof(struct S1));
printf("%zd\n", sizeof(struct S2));
return 0;
}
输出结果:6 12
结构体在对齐方式不合适的时候,我们可以自己修改默认对齐数。
- 结构体传参
#include<stdio.h>
struct A
{
int num[1000];
float price;
}a1 = { {1,2,3,4,5 },3.14f };
//结构体传参
void structPrint1(struct A a1)
{
for (int i = 0; i < 5; i++) {
printf("%d ", a1.num[i]);
}
printf("\n");
printf("%.2f", a1.price);
}
//结构体地址传参
void structPrint2(struct A* a1)
{
for (int i = 0; i < 5; i++) {
printf("%d ", a1->num[i]);
}
printf("\n");
printf("%.2f", a1->price);
}
int main()
{
structPrint1(a1);
printf("\n");
structPrint2(&a1);
return 0;
}
上述函数 structPrint1( ) 和 structPrint2( ) 均可以打印结构体的内容,但是选择 structPrint2( ) 更好,因为:
函数传参的时候,参数是需要压栈的,会有时间和空间上的开销。
如果传递⼀个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
而传递一个地址仅为4/8B的大小,不存在过大的问题。
- 结论: 结构体传参的时候,要传结构体的地址。
- 结构体实现位段
- 位段的声明
位段的成员必须是 int 、unsigned int 或 signed int,在C99中位段成员的类型也可以选择其他类型,例如char类型。
位段的成员名后边有一个冒号和一个数字。
例如:
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
printf("%zd ", sizeof(struct A));
return 0;
}
输出结果:8
- 位段的内存分配问题
注意:位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的。
例如:
#include<stdio.h>
struct stu
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct stu s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
printf("%zd ", sizeof(struct stu));
return 0;
}
输出结果:3
注意:在VS2022环境中,位段的内存分配是从一个内存块(1B或4B)中,由高地址向低地址分配的,如果剩余的大小不够下一个元素的大小,则该内存块的剩余位置将舍弃,在下一个内存块(相较于高地址的一个)中继续存放。
- 位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大为16,32/64位机器最32,如果写为27,在16位机器会出问题)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结: 跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
- 位段的应用
通常用于计算机网络,网络传输的数据大小也会小⼀些,对网络的畅通是有帮助的。
- 位段使用的注意事项
位段的几个成员共用同一个字节,有些成员的起始位置并不是某个字节的起始位置,这些位置是没有地址的。内存中每个字节分配一个地址,一个字节内部的一个bit位是没有地址的。 所以不能对位段的成员使用&操作符,这样就不能使用 scanf( ) 函数直接给位段的成员输入值,只能是先输入放在⼀个变量中,然后赋值给位段的成员。
例如:
struct stu
{
char a : 3;
char b : 4;
};
int main()
{
struct stu s = { 0 };
//错误输入
scanf("%d", &s.a);
//正确输入
s.a = 10;
s.b = 12;
return 0;
}
报错提示:不允许采用位段的地址