C语言自定义类型结构体(24)

tan180°

于 2024-09-15 21:32:28 发布

阅读量718

点赞数 15

分类专栏： C 文章标签： c语言

本文链接：https://blog.csdn.net/2301_80392199/article/details/142287082

版权

C 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

文章目录

前言
一、结构体类型的声明
二、结构体的内存对齐
三、结构体传参
四、结构体实现位段
总结

前言

事实上，我们早就有过关于结构体的学习
现在，我们再来深入理解它一下

一、结构体类型的声明

结构体回顾

结构是一些值的集合，这些值称为成员变量，结构的每个成员可以是不同类型的变量

结构的声明

struct tag
{
member-list;
}variable-list;

例如，我们想要描述一位学生:

struct Stu
{
char name[20]; // 名字
int age; // 年龄
char sex[5]; // 性别
char id[20]; // 学号
}; // 分号不能丢

结构体变量的创建和初始化
运用大括号 { } 即可，在其里面进行初始化
可以按照默认顺序初始化，也可以按照指定顺序初始化
struct Stu s1 = {.age = 30, .name = “Lisi”, .sex = “nv”, .id = “2023020405”};

结构体的特殊声明

在声明结构的时候，可以不完全的声明

// 匿名结构体类型
// 只能使用一次
struct
{
	int a;
	char b;
	float c;
}x;

struct
{
	int a;
	char b;
	float c;
}a[20], *p;

我们可以思考一下，对于上面两个结构体， p = &x; 这样的语句对不对

答案是不对的，虽然两个结构体成员相同，但是因为是匿名的，在编译器看来是两种不同的类型
在这里插入图片描述

大部分情况下我们不会用到匿名结构体的，你在使用的时候也需要注意一下

结构体的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？
可以，我们之后学数据结构的链表就是如此，请持续关注我的博客！

在结构体自引用使用的过程中，夹杂了 typedef 对匿名结构体类型重命名，也容易引入问题

typedef struct
{
	int data;
	Node* next; // err
}Node;

答案是不行的，因为Node是对前面的匿名结构体类型的重命名产生的，但是在匿名结构体内部提前使用Node类型来创建成员变量，这是不行的，一言以蔽之就是，你提前使用了重命名类型

二、结构体的内存对齐

现在我们要来深入探讨一个问题：结构体的大小计算
其实也就是知识点 -> 内存对齐

先让你诧异一下，哈哈，就拿这两个输出作为引子吧！

对齐规则

结构体的对齐规则：

结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
对齐数 = 编译器默认的一个对齐数与该变量成员大小的较小值
- VS中默认的值为8
- Linux中gcc没有默认对齐数，对齐数就是成员自身的大小
结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数，所有对齐数当中最大的)整数倍
如果嵌套了结构体的情况，嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍

struct S1
{
	char c1; // 1Byte
	char c2; // 1Byte
	int i; // 4Bytes
}

我们会发现，起始c1放在偏移量为 0 的位置上，c2放在偏移量为1的位置上，而 int 占 4 个字节，取较小值得到对齐数是 4 ，对齐到 4 的整数倍的位置 4 上，并占 4 5 6 7 这四个位置，并且算下来整个结构体占据了 8 个字节，是最大对齐数 4 的整数倍，所以结构体的总大小为 8 ，浪费了 2 个字节的空间，图示如下：
在这里插入图片描述

我们再来看S2

struct S2
{
	char c1; // 1Byte
	int i; // 4Bytes
	char c2; // 1Byte
}

c1先放在偏移量为 0 的位置上，而 int 占 4 个字节，对齐到整数位置 4 上，并占 4 5 6 7四个位置，而c2占在偏移量为8的位置上，这时候结构体的最大对齐数是4，而结构体的大小为0 ~ 8，为9，不是4的整数倍，因此还要再来 3 个字节，也就是 0 ~ 11，最终，会发现结构体的大小为 12 ，这其中就浪费了 6 个字节的内存空间，图示如下：
在这里插入图片描述

接下来我再给出一个例子，你用做练习自己分析吧

struct S3
{
	double d; // 0 ~ 7
	char c; // 8
	int i; // 12 ~ 15
};

答案是16个字节

那再来个嵌套结构体的：

struct S4
{
	char c1;
	struct S3 s3;
	double d;
};

首先c1放在偏移量为0的位置上，而s3是个结构体，按照上述第五条规则，应该对齐到结构体成员中最大对齐数8的整数倍位置上，显然s3放在8上，并占 8 ~ 23位置，(s3大小为16，前面求过)，这时候double放到对齐数8的整数倍上，刚好24满足，并占24~31位置，这样的话，S4大小为32，恰好也满足了所有成员中对齐数的整数倍这一必要性条件，浪费7个字节，图示如下：
在这里插入图片描述

如果你要验证，可以自己去写输出部分验证，或者可以打开内存监视
亦或者，有一个宏 offsetof ，可以用来计算结构体成员相较于起始位置的偏移量
需要注意的是，这个宏需要包含一个头文件 stddef.h

为什么存在内存对齐？

平台原因（移植原因）：
不是所有的硬件平台都能够访问任意地址上的任意数据；某些硬件平台只能在某些地址处获取某些特定类型的数据，否则则出现硬件异常
性能原因：
数据结构（尤其是栈）应该尽量地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要两次内存访问，而对齐的内存访问只需要一次访问。假设一个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证所有的double类型的数据都在对齐的地址中，那么就可以用一个内存操作来读取者写值了。否则，我们可能需要进行两次内存访问，因为对象可能分散在两个8字节内存块中。
按图来说的话，性能原因如下：

总而言之：结构体的内存对齐是拿空间来换时间的一种做法

所以在设计结构体的时候，我们既要满足对齐，又要节省空间的话，可以考虑将占用内存小的成员尽量集中在一起
比如上述的 S1 和 S2 结构体，S1 设计的就比 S2 好

修改默认对齐数

#pragma 这个预处理指令，可以改变编译器的默认对齐数

#include <stdio.h>  
#pragma pack(1) //设置默认对齐方式为1  
struct S  
{  
    char c1;  
    int i;  
    char c2;  
};  
#pragma pack() //取消设置的对齐，恢复默认  
int main()  
{  
    //输出的结果是什么？  
    printf("%d\n", sizeof(struct S));  
    return 0;  
}

答案是6，自行分析
当我们觉得对齐方式不合理的时候，我们可以自己更改默认对齐数

三、结构体传参

#include <stdio.h>

struct S
{
    int data[1000];
    int num;
};

struct S s = { {1,2,3,4}, 1000 };
//结构体传参  
void print1(struct S s)
{
    printf("%d\n", s.num);
}

//结构体地址传参  
void print2(struct S* ps)
{
    printf("%d\n", ps->num);
}

int main()
{
    print1(s); //传结构体  
    print2(&s); //传地址  
    return 0;
}

上面 printf1 和 printf2 函数哪个好些？
printf2的方式更好一些，也就是说传地址方式更好一些，本质上还是因为形参是实参的一份拷贝，太浪费内存空间了

四、结构体实现位段

你可能只听说过段位，没事，现在我来跟你讲一下位段
没听过很正常，这个知识点比较细致，但是对于了解底层以及未来网络的学习还是很有用的

什么是位段

位段的声明和结构是类似的，有两个不同：

位段的成员必须是int、unsigned int或 signed int，在C99中位段成员的类型也可以选择其他类型
位段的成员名后边有一个冒号和一个数字

struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
}；
// A就是一个位段类型

那么位段A所占内存的大小是多少？
在这里插入图片描述

为什么不是按照前面讲述的内存对齐，是16反而是8？

位段的内存分配

位段的出现就是为了节省空间

位段的成员可以是 int、unsigned int、signed int 或者是 char 等类型。
位段的空间上是按照需要以 4 个字节（int）或者 1 个字节（char）的方式来开辟的。
位段有很多不确定因素，位段是不跨平台的，注意可移植的程序应避免使用位段。(比如说一个字节从左向右还是从右向左使用？)

假设从右向左，来个例子如下：
在这里插入图片描述
_a给两个比特位，_b给5个比特位，_c给10个比特位，_d给30个比特位
_a、_b、_c没什么好说的，但是这个_d就有两种存储方式了，是直接弃掉第一个 int 剩下的15个比特位，新开一个 int 用30个比特位存_d ；还是继续使用完这15个比特位，再新开个 int 用15个存_d，其实，C语言也没有规定，完全取决于编译器，哈哈，这又是不确定性

VS下其实是从右向左存储，如果剩余的空间不够下一个成员使用，就新开空间并浪费
我们来通过下面这段代码来进行验证：

#include <stdio.h>

struct S
{
	// char就好在是一个字节一个字节开辟
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;

	printf("%zd", sizeof(struct S)); // 3
	return 0;
}

首先，a 和 b共占用了7个比特位，剩下1个比特位不够 c ，于是新开一个字节放 c，同理再新开一个字节放 d
在这里插入图片描述
接下来我们给 a 赋值为 10，即1010，截断后三位，放入010，同理b放入1100

这时候，第一个字节的8个比特位就是01100010

同理c放入00011

这时候，第二个字节的8个比特位就是00000011

同理d放入0100

这时候，第三个字节的8个比特位就是00000100

那么，按照十六进制位，这三个字节就是分别就是 0x62、0x03、0x04，打开内存！
在这里插入图片描述

果然如此！！

位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。）
位段中的成员在存储中有右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位置，是含有剩余的位置是利用，这是不确定的。

位段的应用

同开头所说，位段在于网络传输部分还是用处蛮大的
这个自行了解，我也是现查的，具体原理大家自辨

位段使用的注意事项

位段的几个成员共享同一个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位段处是没有地址的。内存中每个字节分配一个地址，一个字节内部的bit位是没有地址的。

所以不能对位段的成员使用&操作符，这样就不能使用scanf直接给位段的成员输入值，只能是先输入放在一个变量中，然后赋值给位段的成员。

struct A  
{  
    int _a : 2;  
    int _b : 5;  
    int _c : 10;  
    int _d : 30;  
};  

int main()  
{  
    struct A sa = {0};  
    scanf("%d", &sa._b); // error
    
    // right 
    int b = 0;  
    scanf("%d", &b);  
    sa._b = b;  
    return 0;  
}