【C语言进阶】自定义类型:结构体,枚举,联合体

本文深入探讨了C语言中的结构体、位段、枚举和联合体。介绍了结构体的声明、内存对齐、自引用及传参,位段的内存分配和应用,枚举的定义、优点和使用,以及联合体的特性、大小计算。文章还讨论了结构体内存对齐的重要性,并提供了实际示例进行验证。
摘要由CSDN通过智能技术生成

目录

1、结构体的声明

1.1 结构体基础知识

1.2 结构体的声明 

1.3 特殊的声明

1.4 结构体的自引用

1.5 结构体变量的定义和初始化

1.6 结构体内存对齐

​编辑1.7 修改默认对齐数

1.8 结构体传参

2. 位段  

2.1 什么是位段

2.2 位段的内存分配  

2.3 位段的跨平台问题

2.4 位段的应用 

3. 枚举  

3.1 枚举类型的定义

3.2 枚举的优点 

 3.3 枚举的使用

4. 联合体(共用体)

4.1 联合类型的定义

4.2 联合体的特点

4.3 联合体大小的计算


1、结构体的声明

1.1 结构体基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2 结构体的声明 

struct Stu
{
	char name[20];
	int age;
	double score;
};//分号不能丢

1.3 特殊的声明

在声明结构体的时候,可以不完全的声明。

//匿名结构体类型
struct
{
	char name[20];
	char id[12];
}ss;

struct
{
	char name[20];
	char id[12];
}*ps;

上面的两个结构在声明的时候省略掉了结构体标签

//在上面代码的基础上,下面的代码合法吗?
p = &x;

struct
{
	char name[20];
	char id[12];
}ss;

struct
{
	char name[20];
	char id[12];
}*ps;
 
int main()
{
	ps = &ss;
	return 0;
}

警告:

编译器会把上面的两个声明当成完全不同的两个类型。
所以是非法的!

1.4 结构体的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢?

struct Node
{
	int data;//数据域
	struct Node* next;//指针域
};
typedef struct
{
	int data;
	Node* next;
}Node;

//这样写代码,可行否?
//解决方案:
typedef struct Node
{
	int data;
	struct Node* next;
}Node;

1.5 结构体变量的定义和初始化

有了结构体类型,那如何定义变量,其实很简单。
 

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1

struct Point p2; //定义结构体变量p2

//初始化:定义变量的同时赋初值。
struct Point p3 = { x, y };

struct Stu //类型声明
{
	char name[15];//名字
	int age; //年龄
};
struct Stu s = { "zhangsan", 20 };//初始化

struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化

struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化

1.6 结构体内存对齐

我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题:计算结构体的大小。
这也是一个特别热门的考点: 结构体内存对齐
先看一下下面的代码:
#include <stdio.h>

struct S1
{
	char c1;//1
	int i;//4
	char c2;//1
};

int main()
{
	struct S1 s;
	printf("%d\n", sizeof(s));
	return 0;
}

 运行结果:

对这个结果是不是感到很疑惑,结果不应该是(1+4+1=6)嘛,为什么答案是12?

要想搞清楚怎么计算结构体大小的,首先得掌握结构体的对齐规则:

1. 第一个成员在与结构体变量偏移量为 0 的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值
  •     VS中默认的值为8(Linux系统下是其本身大小)
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的      整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

那么为什么存在内存对齐呢?

大部分的参考资料都是如是说的:

1. 平台原因 ( 移植原因 ) : 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因 : 数据结构( 尤其是栈 ) 应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总体来说:结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:

让占用空间小的成员尽量集中在一起。  

//例如:
struct S1
{
	char c1;
	int i;
	char c2;
};

struct S2
{
	char c1;
	char c2;
	int i;
};
S1 S2 类型的成员一模一样,但是 S1 S2 所占空间的大小有了一些区别。

 现在回过头再来分析分析之前的代码:

当然了,以上的偏移量只是学习到的理论依据,那该怎么验证呢?

offsetof - 宏
计算结构体成员相对于起始位置的偏移量的

 我们先来看看offsetof是怎么用的:

#include <stdio.h>
#include <stddef.h>

struct S1
{
	char c1;//1
	int i;//4
	char c2;//1
};

int main()
{
	printf("%d\n", sizeof(struct S1));
	printf("%u\n", offsetof(struct S1, c1));
	printf("%u\n", offsetof(struct S1, i));
	printf("%u\n", offsetof(struct S1, c2));
	return 0;
}

运行结果:

1.7 修改默认对齐数

 之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。

#include <stdio.h>

#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

#pragma pack(1)//设置默认对齐数为1
struct S2
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

运行结果:

对齐数是8的,我们上面已经演示过了,下面演示一下对齐数是1的:

得出结论: 结构在对齐方式不合适的时候,我么可以自己更改默认对齐数

1.8 结构体传参

#include <stdio.h>

struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };

//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}

//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}

int main()
{
	print1(s);  //传结构体
	print2(&s); //传地址
	return 0;
}
上面的 print1 print2 函数哪个好些?
答案是:首选 print2 函数。
原因:
1.函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。(在《函数栈帧的创建与销毁》里面提及过, http://t.csdn.cn/UYeTd
2.如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降
结论: 结构体传参的时候,要传结构体的地址。

2. 位段  

2.1 什么是位段

位段的声明和结构是类似的,有两个不同:
1. 位段的成员必须是 int unsigned int , signed int 或char
2. 位段的成员名后边有一个冒号和一个数字。
struct A
{
	int _a : 2;//_a这个成员只占2个bit位
	int _b : 5;//_b这个成员只占5个bit位
	int _c : 10;
	int _d : 30;
};

 A就是一个位段类型。

那位段 A 的大小是多少?
printf("%d\n", sizeof(struct A));

2.2 位段的内存分配  

1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以 4 个字节( int )或者 1 个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
//一个例子
struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	//空间是如何开辟的?
}

我们假设在VS上空间是这样开辟的: 位段中的成员在内存中是从右向左分配的,当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位置,重新开辟一个新的。

 我们来验证一下:

2.3 位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。( 16 位机器最大 16 32 位机器最大 32 ,写成 27 ,在 16 位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结: 跟结构体相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

2.4 位段的应用 

3. 枚举  

枚举顾名思义就是一一列举。
把可能的取值一一列举。

3.1 枚举类型的定义

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};

enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
};

enum Color//颜色
{
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Day enum Sex enum Color 都是枚举类型。
{} 中的内容是枚举类型的可能取值,也叫 枚举常量
这些可能取值都是有值的,默认从 0 开始,一次递增 1 ,当然在定义的时候也可以赋初值。
enum Color//颜色
{
	RED = 1,
	GREEN = 2,
	BLUE = 4
};

int main()
{
	printf("%d\n", RED);
	printf("%d\n", GREEN);
	printf("%d\n", BLUE);
}

3.2 枚举的优点 

为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
1. 增加代码的可读性和可维护性
2. #define 定义的标识符比较枚举有类型检查,更加严谨。
3. 防止了命名污染(封装)
4. 便于调试
5. 使用方便,一次可以定义多个常量

关于第二点,下面给出程序编译的过程,并且解释枚举相对于#define的优点:

 3.3 枚举的使用

enum Color//颜色
{
	RED = 1,
	GREEN = 2,
	BLUE = 4
};
int main()
{
	enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
	clr = 5; //ok
}

4. 联合体(共用体)

4.1 联合类型的定义

联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
//联合类型的声明
union Un
{
	char c;
	int i;
};

//联合变量的定义
union Un un;

//计算连个变量的大小
printf("%d\n", sizeof(un));

4.2 联合体的特点

联合体的成员是共用同一块内存空间的,这样一个联合体变量的大小,至少是最大成员的大小(因为联合体至少得有能力保存最大的那个成员)。
union Un
{
	int i;
	char c;
};
int main()
{
	union Un un;
	// 下面输出的结果是一样的吗?
	printf("%d\n", &(un.i));
	printf("%d\n", &(un.c));
	return 0;
}
//一样

union Un
{
	int i;
	char c;
};
int main()
{
	union Un un;
	//下面输出的结果是什么?
	un.i = 0x11223344;
	un.c = 0x55;
	printf("%x\n", un.i);//11223355
	return 0;
}

调试过程:

由联合体的特点,我们可以改进之前的判断当前计算机的大小端存储:

int check_sys()
{
	union Un
	{
		char c;
		int i;
	}u;
	u.i = 1;

	return u.c;
}

int main()
{
	if (1 == check_sys())
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

4.3 联合体大小的计算

  • 联合体的大小至少是最大成员的大小。
  • 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
	char c[5];
	int i;
};

union Un2
{
	short c[7];
	int i;
};

int main()
{
	//下面输出的结果是什么?
	printf("%d\n", sizeof(union Un1)); //8
	printf("%d\n", sizeof(union Un2));//16
}

评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值