qq正文开始:
1.结构体概念
结构体是C语言中一种重要的数据类型,该数据类型由一组称为成员(或称为域,或称为元素)的不同数据组成,其中每个成员可以具有不同的类型。结构体通常用来表示类型不同但是又相关的若干数据。——解释来源百度
结构体类型不是由系统定义好的,而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。——解释来源百度
关键字struct和结构体名组合成一种类型标识符,其地位如同通常的int、char等类型标识符,其用途就像 int 类型标识符标识整形变量一样可以用来定义结构体变量。定义变量以后,该变量就可以像定义的其他变量一样使用了;成员又称为成员变量,它是结构体所包含的若干个基本的结构类型,必须用“{}”括起来,并且要以分号结束,每个成员应表明具体的数据类型。——解释来源百度
//struct 为结构体关键字
//tag 为结构体标签
struct tag
{
member-list;
//结构体成员
}variable-list;
//用这个类型定义了一个结构体变量 variable-list
//variable-list 为全局变量
例如描述一个学生:
//Stu 为结构体名
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}; //分号不能丢
#include <stdio.h>
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
int main()
{
//按照结构体成员的顺序初始化
struct Stu s = { "张三", 20, "男", "20230818001" };
printf("name: %s\n", s.name);
printf("age : %d\n", s.age);
printf("sex : %s\n", s.sex);
printf("id : %s\n", s.id);
//按照指定的顺序初始化
struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex ="女"};
printf("name: %s\n", s2.name);
printf("age : %d\n", s2.age);
printf("sex : %s\n", s2.sex);
printf("id : %s\n", s2.id);
return 0;
}
结果为:
从这个代码中我们可以看出对于结构体的调用我们需要用 .结构体成员名 来调用。
1.2 结构的特殊声明
在声明结构的时候,可以不完全声明。
比如:
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
上面的两个结构在声明的时候省略掉了结构体标签(tag)。
那么问题来了?
//在上⾯代码的基础上,下⾯的代码合法吗?
p = &x;
总体代码为:
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], * p;
int main()
{
p = &x;
return 0;
}
警告:
编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。 匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用一次。
1.3 结构的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
比如,定义一个链表的节点:
struct Node
{
int data;
struct Node next;
};
上述代码正确吗?如果正确,那 sizeof(struct Node) 是多少?
#include <stdio.h>
struct Node
{
int data;
struct Node next;
};
int main()
{
int a = sizeof(struct Node);
printf("%d", a);
return 0;
}
结果如下:
仔细分析,其实是不行的,因为一个结构体中再包含一个同类型的结构体变量,这样结构体变量的大小就会无穷的大,是不合理的。
正确的子引用方式:
struct Node
{
int data;//数据域
struct Node* next;//指针域
};
在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引入问题,看看下面的代码,可行吗?
typedef struct
{
int data;
Node* next;
}Node;
答案是不行的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。
解决方案如下:定义结构体不要使用匿名结构体了。
typedef struct Node
{
int data;
struct Node* next;
}Node;
2. 结构体内存对齐
我们已经掌握了结构体的基本使用了。 现在我们深入讨论一个问题:计算结构体的大小。 这也是一个特别热门的考点: 结构体内存对齐
2.1 对齐规则
首先得掌握结构体的对齐规则:
1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数=编译器默认的⼀个对齐数与该成员变量大小的较小值。
- VS 中默认的对齐数为 8
- Linux中gcc没有默认对齐数,对⻬数就是成员自身的大小
3. 结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数中最大的)的 整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构 体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
我们来看个题:
//练习1
struct S1
{
char c1; // char占1个字符
int i; // int占4个字符
char c2; // 1个字符
};
printf("%d\n", sizeof(struct S1));
我们先来分析:
根据上诉规则的第一条:char c1应该放在与结构体变量起始位置偏移量为0处
第二条:因为VS的对齐数是8,但是struct S1里的最大对齐数是4,于是我们选择4,因为int占据4个字节,所以在内存中从偏移量为4的位置占据,分别占4,5,6,7。char c2占据1个字节,于是我们选择占8。从c1的0到c2的8,一共占到了9个字节。
规则3:结构体总大小为最大对齐数的 整数 倍。这道题中最大对齐数是4,因为结构体总大小是4的倍数而且还需要大于9,所以我们选择最接近的值12。(为什么是12而不是其他值,我个人认为是为了节省空间)
那么答案到底是不是12呢?
答案:
趁热打铁:
//练习2
struct S2
{
char c1;// 1
char c2;// 1
int i;// 4
};
printf("%d\n", sizeof(struct S2));
1.char c1应该放在与结构体变量起始位置偏移量为0处
2.char c2放在偏移量为1处
3.int i放在偏移量为4处,分别放置4,5,6,7
答案依然为int字节的整形
所以此题答案应为:8
我再给大家两道练习题,答案我会放在文章末。
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
//练习4结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;//把它看成一个普通的类型就可以
double d;
};
printf("%d\n", sizeof(struct S4));
2.2 为什么存在内存对齐
大部分的参考资料都是这样说的:
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则出现硬件异常
2. 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:让占用空间小的成员尽量集中在一起。
//例如:
struct S1
{
char c1;//1
int i;//4
char c2;//1
};
// 答案:12
struct S2
{
char c1; // 1
char c2;// 1
int i;// 4
};
//答案:8
S1 和 S2 类型的成员一模一样,但是 S1 和 S2 所占空间的大小有了一些区别。
2.3 修改默认对齐数
#pragma 这个预处理指令,可以改变编译器的默认对齐数。
例如:
#include <stdio.h>
#pragma pack(1)
//设置默认对⻬数为1
struct S
{
char c1;
int i;
char c2;
};
#pragma pack()
//取消设置的对⻬数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S));
return 0;
}
我们将每个数的默认对齐数更改为了1
struct S
{
//原本对齐数 默认 结果
char c1;// 1 1 1
int i;// 4 1 1
char c2;//1 1 1
};
那么这个题依次进行放置就可以了。
c1放在0处,i放1,2,3,4处,c2放5处。一共占据6个字节的大小,所以struct S的大小为 6。
结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。
3. 结构体传参
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
那么答案是什么呢?
我们可以看到,答案是一样的。只是单纯的结构体传参和结构体地址传参格式不同。
上面的print1和print2哪个好?
答案是:首选print2函数。
原因:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论: 结构体传参的时候,要传结构体的地址。