【C语言进阶】- 自定义类型详解

No more cages

已于 2024-01-19 14:09:43 修改

阅读量150

点赞数

分类专栏： C语言进阶文章标签： c语言开发语言

于 2023-07-28 11:25:27 首次发布

本文链接：https://blog.csdn.net/KQ_EB/article/details/131940512

版权

C语言进阶专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章详细介绍了C语言中的结构体，包括声明、自引用、变量定义与初始化、内存对齐以及结构体传参。接着讨论了位段的声明、内存分配和跨平台问题。枚举部分讲解了其定义、优点和使用。最后，解释了联合类型，强调了成员共享存储空间的特点，并展示了如何利用联合判断系统字节序。

摘要由CSDN通过智能技术生成

本章重点

结构体
结构体类型的声明
结构的自引用
结构体变量的定义和初始化
结构体内存对齐
结构体传参
结构体实现位段（位段的填充&可移植性）
枚举
枚举类型的定义
枚举的优点
枚举的使用
联合
联合类型的定义
联合的特点
联合大小的计算

结构体

1 结构体的声明

1.1 结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

数组：一组相同类型元素的集合

1.2 结构的声明

结构的声明
struct tag <-- 自定义
{
member - list; <-- 成员列表
}variable-list; < -- 变量列表

#include<stdio.h>

struct Stu
{
	char name[20];
	int age;
	char id[20];
};

struct Stu s1;

struct Stu
{
	char name[20];
	int age;
	char id[20];
}s1, s2, s3;

1.3 特殊的声明

struct 
{
	int a;
	char c;
	float f;
}x;//匿名结构体类型只能用一次	

struct
{
	int a;
	char c;
	float f;
}*p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。

那么问题来了？

//在上面代码的基础上，下面的代码合法吗？

p = &x;

警告：编译器会把上面的两个声明当成完全不同的两个类型。

所以是非法的。

1.4 结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？

struct Node
{
 int data;
 struct Node next;
};
//可行否？
如果可以，那sizeof(struct Node)是多少？

正确的自引用方式：

struct Node
{
 int data;
 struct Node* next;
};

注意：

typedef struct//先对这个类型重命名才产生的Node，
所以必须是个合格完整的类型
{
 int data;
 Node* next;//不是完整的命名这个Node哪里来的
}Node;
//这样写代码，可行否？
//先有鸡还是先有蛋问题
//解决方案：不匿名就行了
typedef struct Node
{
 int data;
 struct Node* next;
}Node;

1.5 结构体变量的定义和初始化

struct SN
{
	char c;
	int i;
	//顺着类型直接创建变量，即声明类型的同时定义变量p1
}sn1, sn2;//全局变量

int main()
{
	//有了类型之后单独创建变量，即定义结构体变量p2
	struct Stu stu3, stu4;//局部变量
	return 0;
}

struct SN
{
	char c;
	int i;
 //顺着类型直接创建变量
}sn1 = { 'q', 100 }, sn2 = {.i=200, .c='W'};//全局变量

struct S
{
	double d;
	struct SN sn;
	int arr[10];
};

int main()
{
	//struct Stu stu3, stu4;//局部变量
	printf("%c %d\n", sn1.c, sn1.i);

	struct S s = { 3.14, {'a', 99}, {1, 2, 3} };//结构体嵌套初始化
	printf("%lf %c %d\n", s.d, s.sn.c, s.sn.i);
	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ", s.arr[i]);
	}
	return 0;
}

运行结果：

1.6 结构体内存对齐

现在我们深入讨论一个问题：计算结构体的大小。

struct S1
{
	char c1;//1
	int i;	//4
	char c2;//1
};

struct S2
{
	int i;	//4
	char c1;//1
	char c2;//1
};

int main()
{
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

原因是涉及到了内存对齐。

offsetof();宏可以计算结构体成员相较于结构体起始位置的偏移量

struct S1
{
	char c1;//1
	int i;	//4
	char c2;//1
};

struct S2
{
	int i;	//4
	char c1;//1
	char c2;//1
};

int main()
{
	//printf("%d\n", sizeof(struct S1));
	//printf("%d\n", sizeof(struct S2));
	//offsetof();宏 可以计算结构体成员相较于结构体起始位置的偏移量
	printf("%d\n", offsetof(struct S1, c1));//offsetof有头文件
	printf("%d\n", offsetof(struct S1, i));
	printf("%d\n", offsetof(struct S1, c2));
	return 0;
}

运行结果：

上面的现象分析，我们发现结构体成员不是按照顺序在内存中连续存放的，而是有一定的对齐规则的

首先得掌握结构体的对齐规则：

结构体内存对齐的规则：
1.结构体的第一个成员永远放相较于结构体变量起始位置在对偏移量为0的地方

2.从第二个成员开始，往后的每个成员都要对齐到某个对齐数的整数倍处
对齐数：结构体成员自身大小和默认对齐数的较小值
VS中默认的值为8

Linux中没有默认对齐数，对齐数就是成员自身的大小

3.结构体的总大小，必须是最大对齐数的整数倍
最大对齐数是：所有成员的对齐数中最大的值

4.如果嵌套了结构体的情况，嵌套的结构体对齐自己的最大对齐数的整数倍处，结构体的
整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍

为什么存在内存对齐?

1.平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

2. 性能原因：

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。

原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在一起。

struct S1
{
 char c1;
 int i;
 char c2;
};

struct S2
{
 char c1;
 char c2;
 int i;
};

1.7 修改默认对齐数

之前我们见过了 #pragma 这个预处理指令，这里我们再次使用，可以改变我们的默认对齐数。

注意：不要修改奇怪的数字，尽量是2的0次方、1次方。。。

#pragma pack(1)
struct S1
{
	char c1;//1 1 1
	int a;//  4 1 1
	char c2;//1 1 1
};
#pragma pack()

int main()
{
	printf("%d\n", sizeof(struct S1));
	return 0;
}

结论：结构在对齐方式不合适的时候，可以自己更改默认对齐数

1.8 结构体传参

struct S
{
	int date[1000];
	int num;
};

void print1(struct S tmp)
{
	printf("%d\n", tmp.num);
}

void print2(const struct S *ps)
{
	printf("%d\n", ps->num);
}

int main()
{
	struct S s = { {1, 2, 3}, 100 };
	print1(s);
	print2(&s);
	return 0;
}

运行结果：

print2更好

原因：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。

如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

2. 位段

了解结构体实现位段的能力。

2.1 什么是位段

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字。

struct A
{
	int _a : 2;//二进制位
	int _b : 5;
	int _c : 10;
	int _d : 30;
};

int main()
{
	printf("%d\n", sizeof(struct A));
	return 0;
}

运行结果：

2.2 位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

思路：

#include<stdio.h>

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};//补0凑齐比特位

int main()
{
	struct S s = { 0 };
	s.a = 10;//1010 -> 010
	s.b = 12;//1100
	s.c = 3;//011 -> 00011
	s.d = 4;//0100
	printf("%d\n", sizeof(s));//前面空间浪费了占三个字节

	return 0;
}

运行结果：

监视内存：

2.3 位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台的问题存在。

2.4 位段的应用

IP数据包格式：

3. 枚举

枚举顾名思义就是一一列举。

把可能的取值一一列举。

例如一周的一到星期日可以一一列举。

3.1 枚举类型的定义

enum Color
{
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。

{}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，依次递增1，当然在声明枚举类型的时候也可以赋初值。

enum Color
{
	RED = 4,
	GREEN,
	BLUE
};

int main()
{
	//enum Color c = RED;
	//enum COlor d = GREEN;
	printf("%d\n", RED);
	printf("%d\n", GREEN);
	printf("%d\n", BLUE);
	return 0;
}

运行结果：

3.2 枚举的优点

为什么用枚举？

我们可以使用 #define 定义常量，为什么非要使用枚举？

枚举的优点：

1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查，更加严谨。

3. 便于调试

4. 使用方便，一次可以定义多个常量

3.3 枚举的使用

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 5;//cpp里不行

4. 联合（共用体）

4.1 联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	return 0;
}

运行结果：

为什么不是5呢？

代码：

union Un
{
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };

	printf("%p\n", &un);
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));
	return 0;
}

运行结果：

思路：

运行分析问题
联合体 - 共用体
同一时间只能用一个

再看一段代码：

union Un
{
	char c;
	int i;
};

int main()
{

	printf("%d\n", sizeof(union Un));
	union Un un = { 0 };
	un.i = 0x11223344;
	un.c = 0x55;
	return 0;
}//取地址un

调试中看内存：

判断计算机的用的是大端还是小端

思路：

代码：

union Un
{
	int i;
	char c;
};

int main()
{
	union Un u = { 0 };
	u.i = 1;
	if (u.c == 1)
	{
		printf("是小端\n");
	}
	else
	{
		printf("是大端\n");
	}
	return 0;
}

封装成函数：

int check_sys()
{
	union 
	{
		int i;
		char c;
	}un = {.i = 1};
	return un.c;
}

int main()
{
	int ret = check_sys();

	if (ret == 1)
	{
		printf("是小端");
	}
	else
	{
		printf("是大端");
	}
	return 0;
}

思路：

4.3 联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

代码：

union Un1
{
	char c[5];//5 1 8 1 //成员大小 自身大小 默认对齐数 最小对齐数
	int i;//    4 4 8 4
};

union Un2
{
	short s[7];//14 2 8 2
	int i;//      4 4 8 4
};

int main()
{
	printf("%d\n", sizeof(union Un1));//是4的倍数 5 + 3 = 8
	printf("%d\n", sizeof(union Un2));//是4的倍数 14 + 2 = 16

	return 0;
}

运行结果：