C语言进阶——chapter4——自定义类型之结构体

不吃肉的Humble

已于 2023-12-01 16:49:56 修改

阅读量103

点赞数 1

分类专栏： C语言语法进阶文章标签： c语言开发语言后端

于 2023-12-01 16:29:38 首次发布

本文链接：https://blog.csdn.net/2301_79345909/article/details/134664529

版权

C语言语法进阶专栏收录该内容

8 篇文章 0 订阅

订阅专栏

前言

大家好呀，我是Humble,今天要给大家带来的内容是自定义类型

关于自定义类型，有结构体，联合和枚举

今天我们先来分享结构体，这个概念我们在讲操作符详解的时候已经粗略涉及过，今天我们就来详细讲解一下结构体这个概念吧

接下来，开始今天的分享

一.结构体类型的声明

首先，我们先来复习一下之前学过的结构体的知识

1.结构体回顾

我们知道，结构是一些值的集合，这些值称为成员变量，结构的每个成员可以是不同类型的变量

a.结构的声明

比如我们想描述一个学生，我们可以这样创建结构体变量

struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}; //分号不能丢!!!!

b.结构体变量的初始化

这里的初始化又可以分为2类，分别是：按照结构体成员的顺序初始化和按照指定的顺序初始化

首先是按照结构体成员的顺序初始化

struct Stu s1 = { "张三", 20, "男", "20230818001" };
printf("name: %s\n", s1.name);
printf("age : %d\n", s1.age);
printf("sex : %s\n", s1.sex);
printf("id : %s\n", s1.id);

然后是按照指定的顺序初始化

	struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex = "⼥"};
	printf("name: %s\n", s2.name);
	printf("age : %d\n", s2.age);
	printf("sex : %s\n", s2.sex);
	printf("id : %s\n", s2.id);

2.结构的特殊声明

其实，在声明结构的时候，可以不完全的声明

例如：

//2个匿名结构体类型

struct

{
	int a;
	char b;
	float c;
}x;


struct
{
	int a;
	char b;
	float c;
} *p;

这样子看起来很方便，在声明的时候省略掉了结构体标签，

那么问题来了：

在上面代码的基础上，

p = &x; 这句代码合法吗？

答：这是非法的，如果我们运行一下的话就会发现编译器报警告了

因为编译器会把上面的两个声明当成完全不同的两个类型

所以说，匿名的结构体类型，如果没有对结构体类型重命名的话，基本上只能使用⼀次

3.结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？

比如，定义一个链表的节点

（注意：链表是我们后期学习数据结构的时候会专门讲的一种结构，这里暂时先不讲）

我们看下面代码

struct Node
{
 int data;  //存放数据
 struct Node next;  //在结构中包含一个类型为该结构本身的成员
};

上述代码正确吗？，如果正确，那 sizeof(struct Node) 是多少？

仔细分析，其实是不行的，因为一个结构体中再包含一个同类型的结构体变量，这样结构体变量的大小就会无穷的大，是不合理的

正确的自引用方式：

struct Node
{
 int data;  //存放数据
 struct Node* next;  //存放下一个节点的地址
};  //这是可行的

所以说，在结构体里有一个同类型的结构指针是可行的

好，我们再来思考一个问题：

看看下面的代码，可行吗？

typedef struct
{
 int data;
 Node* next;
}Node;

答案是不行的，因为Node是对前面的匿名结构体类型的重命名产生的

但是在匿名结构体内部提前使用Node类型来创建成员变量，这是不行的。

所以我们定义结构体不要使用匿名结构体了

typedef struct Node
{
 int data;
 struct Node* next;
}Node;  //这是可行的

二.结构体内存对齐

好了，我们现在已经掌握了结构体的基本使用了

现在我们深入讨论一个问题：计算结构体的大小

这也是一个特别热门的考点： 结构体内存对齐

大家先来看下面这个代码，我们以它作为一个引子

我们看一下下面两个结构体的大小关系是怎么样的，它们会一样吗？

一个是8，一个是12

这是为什么呢？是怎么计算的呢？

好，我们带着问题开始下面的学习吧！

1.对齐规则

首先得掌握结构体的对齐规则：

1. 在内存中，结构体的第⼀个成员对⻬到和结构体变量偏移量为0（也就是起始位置）的地址处

下面是图示，方便大家理解：

2. 其他成员变量要对齐到某个数字（即对齐数）的整数倍的地址处

对齐数 = 编译器默认的⼀个对⻬数 与该成员变量大小的较小值

（在VS 中默认的值为 8 。在Linux中 gcc 没有默认对齐数，对齐数就是成员自身的大小）

3. 结构体总大小为最大对齐数（结构体中每个成员变量都有一个对齐数，所有对齐数中最大的）的整数倍

4. 如果嵌套了结构体的情况，嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体中成员的对齐数）的整数

好了，有了这几点，我们就可以解释上面引子中为什么strust S1大小是8，struct S2的大小是12了

我们先看strust S1

首先，c1是char类型，作为结构体的第一个成员，存在起始位置偏移值为0的地址处

c2也是char类型，大小是1，它属于其他成员变量，所以要对齐到1的整数倍的地址处，也就是1的地址处

i是int类型，大小是4，它属于其他成员变量，所以要对齐到4的整数倍的地址处也就是4的地址处

因为3和4的地址处没有存放，所以这块空间是浪费的

因为结构体总带线啊哦为最大对齐数的整数倍，即4的倍数，8是满足的，所以总空间占用了8

下面是理解图：

好，接下来我们再看一下strust S2

首先，c1是char类型，作为结构体的第一个成员，存在起始位置偏移值为0的地址处

然后我们放i，i是int类型，大小是4，它属于其他成员变量，所以要对齐到4的整数倍的地址处也就是4的地址处占了4567这些地址

c2是char类型，大小是1，它也属于其他成员变量，所以要对齐到1的整数倍的地址处，也就是8的地址处

这时因为结构体总大小不是最大对齐数的整数倍，大小是9，要使它为4的倍数满足，就要使得大小为12，这样9 10 11的空间就浪费了

所以总空间占用了12

下面是理解图：

紧接着，我们先来练上几题，想一下输出结果会是多少？

struct S3
{
	double d;
	char c;
	int i;
};
int main()
{
	printf("%d\n", sizeof(struct S3));
}

下面是运行结果：（先自己思考一下哦）

我们也来分析一下吧：

首先，d是double类型，作为结构体的第一个成员，存在起始位置偏移值为0的地址处占01234567

c是char类型，大小是1，它也属于其他成员变量，所以要对齐到1的整数倍的地址处，也就是8的地址处

然后我们放i，i是int类型，大小是4，它属于其他成员变量，所以要对齐到4的整数倍的地址处也就是12的地址处占了12 13 14 15这些地址

这时因为结构体总大小是最大对齐数的整数倍，大小是16，它为4的倍数满足

所以总空间占用了16

下面是理解图：

再看一道题，（温馨提示：这个练习会涉及对齐规则的第4点：结构体嵌套）

下面是运行结果：（请先自己思考一下哦）

我们来分析一下：

首先，c1是char类型，作为结构体的第一个成员，存在起始位置偏移值为0的地址处占一个字节

然后是s3，是struct S3类型，大小是16（这是我们在上一题算过的），它属于其他成员变量而且是嵌套了结构体的情况

嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处，（即double的8）

所以要对齐到8的整数倍的地址处，也就是8的地址处，一直占16个字节到23的地址处

最后我们放d，d是double类型，大小是8，它属于其他成员变量，所以要对齐到8的整数倍的地址处也就是24的地址处占了24 25 26 27 28 29 30 31

这时因为结构体总大小是最大对齐数的整数倍，大小是32，它为8的倍数满足（S3中的最大元素是8，在S4中除了这个嵌套的类型外，其他类型最大也是8，所以取8）

所以总空间占用了32

下面是理解图：

2.为什么存在内存对齐？

我们在学习上面的内存对齐的时候一定会有疑惑，为什么一定要浪费空间呢？

这里我们分2个原因来讲：

a.平台问题（移植问题）

不是所有的硬件平台都能访问任意地址上的任意数据的

某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常

b.性能问题

数据结构(尤其是栈)应该尽可能地在自然边界上对齐

原因在于：为了访问未对齐的内存，处理器需要作两次内存访问，而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数，那么就可以用一个内存操作来读或者写值了。否则，我们可能需要执行两次内存访问，因为对象可能被分放在两个8字节内存块中

总体来说：结构体的内存对齐是拿空间来换取时间的做法

那在设计结构体的时候，我们既要满足对齐又要节省空间，如何做到？

//让占用空间小的成员尽量集中在⼀起
//例如：
struct S1
{
	char c1;
	char c2;
	int i;
};
struct S2
{
	char c1;
	int i；
    char c2；
};

这里的S1 和 S2 类型的成员一模⼀样，但是 S1 和 S2 所占空间的大小有了一些区别

一个是8，一个是12；

3.修改默认对齐数

我们在讲对齐规则的第2点提到了默认对齐数，这意味着对齐数是可以修改的

#pragma 这个预处理指令，可以改变编译器的默认对⻬数

#pragma pack(1)  //设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的对齐数，还原为默认

那我们来练一下

#pragma pack(1)  //设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};


int main()
{
	//输出的结果是什么？
	printf("%d\n", sizeof(struct S));
	return 0;
}

输出结果如下：

当我们认为结构体在对齐方式不合适的时候，我们就可以自己更改默认对齐数了~

三.结构体传参

下面的 print1 和 print2 函数哪个好些

答案是：选print2函数。原因：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销

如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降

结论：结构体传参的时候，要传结构体的地址

四.结构体实现位段

结构体讲完就得讲讲结构体实现位段的能力

1.什么是位段

位段是基于结构体的

位段的声明和结构是类似的，但有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。不过在C99中，位段成员的类型也可以选择其他类型

2.位段的成员名后边有一个冒号和一个数字

下面来举个例子：

A就是一个位段类型

那位段A所占内存的大小是多少？

int main()
{
  printf("%d\n", sizeof(struct A));
  return 0;
}

我们如果按结构体大小方式去算，打印会得到16

但我们打印的结果却是8

冒号后面表示这个变量需要几个bit（比特位）

上面的2+5+10+30=47个比特位，因为8个字节就可以存下47个比特位，所以打印结果是8不是16

所以从结果上，我们可以看出：位段的出现就是为了节省空间

我们可能有个问题，就是6个字节也可以存下47个比特位，那为什么结果不是6呢？

所以接下面我们具体看一下位段的内存分配

2.位段的内存分配

1. 位段的成员可以是 int ，unsigned int 或者是 char 等类型

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的⽅式来开辟的

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使⽤位段

//⼀个例⼦
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的？

为了解出上面的代码，我们下面来讲一下VS的存储习惯：

1.从右向左使用

2.如果剩余的空间不够下一个成员使用，就浪费，然后开辟新的空间

那按照这个想法，我们只需开辟3个字节，然后我们可以得到s中的存储应该是：

01100010 00000011 00000100

转换成16进制就是 62 03 04

我们调试一下，看一下结果是否如我们所想：

我们发现，结果正如我们所想

如果我们打印s的大小，结果也肯定只有3个字节的大小

当然，所有的这些仅仅针对VS，对于其他编译器是不确定的，这就是为什么上面说：

位段是不跨平台的

那么既然说到这个，接下来给大家聊聊4个位段的跨平台问题

3.位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32。写成27，在16位机器会出问题

3. 位段中的成员在内存中从左向右分配，还是从右向左分配，标准尚未定义

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的

总结：跟结构相比，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台问题的存在

4.位段使用的注意事项

位段的几个成员共有同一个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位置处是没有地址的。内存中每个字节分配一个地址，一个字节内部的bit位是没有地址的

所以不能对位段的成员使用&操作符，这样就不能使用scanf直接给位段的成员输入值

只能是先输入放在一个变量中，然后赋值给位段的成员

struct A
{
 int _a : 2;
 int _b : 5;
 int _c : 10;
 int _d : 30;
};

int main()
{
 struct A sa = {0};

 scanf("%d", &sa._b);//这是错误的！！！
 
 //正确的⽰范
 int b = 0;
 scanf("%d", &b);
 sa._b = b;

 return 0;
}