【C语言】详解自定义类型：结构体，枚举，联合

烧鸡配油茶

已于 2024-06-01 15:07:49 修改

阅读量704

点赞数 40

分类专栏： C语言文章标签：开发语言学习 c语言

于 2024-03-20 09:58:22 首次发布

本文链接：https://blog.csdn.net/weixin_61400132/article/details/136865534

版权

C语言专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文详细介绍了C语言中的结构体、枚举和联合的基本概念、声明、变量定义、成员访问、传参以及内存对齐等特性，包括结构体的自引用、内存对齐规则、位段的使用和联合的特性和大小计算。

摘要由CSDN通过智能技术生成

1.7结构体实现位段（位段的填充&可移植性）

前言

C语言中有很多内置的数据类型例如:int double ...等等。但我们在现实中有很多复杂对象需要描述。C语言中描述复杂对象的方式分别有结构体，枚举，联合，本期博客就让我们一起学习它们吧！

一、结构体

基础部分

1.1结构体类型的声明

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

普通声明

struct tag
{
    member-list;
}variable-list;

解释：

struct tag
{
member-list;
}

程序员自己定义的一种类型---->结构体类型---->这种类型的名字struct tag ---->可以用这种类型创建变量

tag：根据实际情况命名

variable-list：该类型创建的结构体类型

例如描述一个学生：

typedef struct Stu

{
    char name[20];//名字

    int age;//年龄

    char sex[5];//性别

    char id[20];//学号

}Stu; //分号不能丢
//Stu是重命名产生的一个新的数据类型

总结：

创建(定义)结构体变量的2种方式
1.声明结构体类型时，顺便创建。(注：创建的是全局变量)
2. struct tag s1，s1就是tag类型的结构体变量
ps:如果想省略 struct tag中的struct ，用tag直接定义结构体变量
需要使用typedef进行类型重命名
解释： typedef 对结构体类型 struct stu 重新起名字叫 Stu

结构体匿名声明

在声明结构的时候，可以不完全的声明。比如：

//匿名结构体类型
struct
{
     int a;
     char b;
     float c;
}x;
struct
{
     int a;
     char b;
     float c;
}a[20], *p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。那么问题来了？

//在上面代码的基础上，下面的代码合法吗？
p = &x;

警告：编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的！！！

1.2结构体变量的定义和初始化

有了结构体类型，那如何定义变量，其实很简单。

代码示例：

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化：定义变量的同时赋初值。
struct Point p3 = { x, y };
struct Stu        //类型声明
{
	char name[15];//名字
	int age;      //年龄
};
struct Stu s = { "zhangsan", 20 };//初始化
struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化

struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化

1.3结构体成员访问

结构体变量访问成员

结构变量的成员是通过点操作符（.）访问的。点操作符接受两个操作数。

例如：我们可以看到 s 有成员 name 和 age ；那我们如何访问s的成员？

struct Stu
{
	char name[20];
	int age;
};

struct Stu s;
strcpy(s.name, "zhangsan");//使用.访问name成员
s.age = 20;//使用.访问age成员

结构体指针访问指向变量的成员

有时候我们得到的不是一个结构体变量，而是指向一个结构体的指针。那该如何访问成员？

如下：

struct Stu
{
	char name[20];
	int age;
};

void print(struct Stu* ps)
{
    printf("name = %s   age = %d\n", (*ps).name, (*ps).age);
    //使用结构体指针访问指向对象的成员
    printf("name = %s   age = %d\n", ps->name, ps->age);
}
int main()
{
    struct Stu s = { "zhangsan", 20 };
    print(&s);//结构体地址传参
    return 0;
}

1.4结构体传参

代码示例：

struct S
{
 int data[1000];
 int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
 printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
 printf("%d\n", ps->num);
}
int main()
{
 print1(s);  //传结构体
 print2(&s); //传地址
 return 0;
}

上面的 print1 和 print2 函数哪个好些？

答案是：首选print2函数（传址调用）。

原因：函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

进阶部分

1.5结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？

struct Node
{
     int data;
     struct Node next;
};

答案是不行的！！！

正确的自引用方式：在结构体中包含同类型结构体的指针

struct Node
{
    int data;//数据
    struct Node* next;//下一个节点
};

typedef struct Node
{
	int data;//存放数据-数据域
	struct Node* next;//存放下一个节点的地址-指针域
}Node;

1.6图解结构体内存对齐（重点）

问题的提出：从上图我们可以发现，两个结构体成员变量相同，但是成员变量的顺序不同，从而两个结构体大小不同，这是为什么呢？

穿插知识点：offsetof宏

用于计算结构体成员相较于起始位置的偏移量。

使用时需要包含头文件<stddef.h>

使用offsetof宏进一步观察每个成员变量相较于起始位置的偏移量：

图解如下：

其他示例：

注意：嵌套的结构体对齐到自己成员变量的最大对齐数的整数倍处，S3的最大成员对齐数是8，所以S3起始的存储位置应该是8的倍数！！

所以结构体内存的大小到底如何计算？首先我们要掌握结构体的对齐规则

对齐规则

1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。

VS中默认的值为8

3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

为什么对齐？

1. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据（比如一次只读4或者8个字节，并且每次都从整数倍开始读），否则抛出硬件异常

2. 性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

结构体的内存对齐是拿空间来换取时间的做法。

举个栗子：对齐 VS 不对齐的情况!

假设硬件要求一次读四个字节，若结构体不是内存对齐的话。对于读取变量i没有影响。对于读取变量a来说：第一次从0的位置读取，获取a的前三个字节，第二次从4的位置读取，获取a的后一个字节。两次访问内存结果拼在一起才能得到变量a！

那在设计结构体的时候，既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在一起！！！

修改默认对齐数

代码示例：

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
    //输出的结果是什么？
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
        return 0;
}

结构在对齐方式不合适的时候，我么可以自己更改默认对齐数！

1.7结构体实现位段（位段的填充&可移植性）

结构体讲完就得讲讲结构体实现位段的能力。位段的出现就是为了节省空间。

什么是位段

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。（C99之后也可以是其他类型）

2.位段的成员名后边有一个冒号和一个数字。

比如:

struct A
{
    int _a : 2;
    int _b : 5;
    int _c : 10;
    int _d : 30;
};

a占2个bit位

b占5个bit位

A就是一个位段类型。那位段A的大小是多少？

图解位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };

	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	printf("%d\n", sizeof(struct S));
	return 0;
}

空间是如何开辟的？

调试测试：

位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

二、枚举

枚举顾名思义就是一一列举。把可能的取值一一列举。比如我们现实生活中：一周的星期一到星期日是有限的7天，可以一一列举。性别有：男、女、保密，也可以一一列举。月份有12个月，也可以一一列举这里就可以使用枚举了。

2.1枚举类型的定义

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};
enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
}；
enum Color//颜色
{
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，依次递增1，当然在定义的时候也可以赋初值。

例如：

enum Color//颜色
{
   RED=1,
   GREEN=2,
   BLUE=4
};

2.2枚举的优点

为什么使用枚举？

我们可以使用 #define 定义常量，为什么非要使用枚举？

枚举的优点：

1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查，更加严谨。

3. 防止了命名污染（封装）

4. 便于调试

5. 使用方便，一次可以定义多个常量

2.3枚举的使用

enum Color//颜色
{
  RED=1,
  GREEN=2,
  BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 5;               //ok??不推荐这样写 代码可读性降低

三、联合（共用体）

3.1联合类型的定义

联合也是一种特殊的自定义类型

这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

比如：

//联合类型的声明
union Un
{
	char c;//1
	int i;//4
};

int main()
{
    //联合变量的定义
	union Un un;
	printf("%p\n", &un);
	printf("%p\n", &(un.c));
	printf("%p\n", &(un.i));
    //计算连个变量的大小
    printf("%d\n", sizeof(un));

	return 0;
}

3.2联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。

面试题：判断当前计算机的大小端存储

//方法一
int check_sys()
{
	int a = 1;
	return *(char*)&a;//返回1表示小端，返回0表示大端
}
//方法二
int check_sys()
{
    //匿名联合体
	union
	{
		char c;
		int i;
	}u;

	u.i = 1;
	return u.c;//返回1表示小端，返回0表示大端
}

int main()
{
	int ret = check_sys();
	if (ret == 1)
		printf("小端\n");
	else
		printf("大端\n");

	return 0;
}

3.3联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

比如：

union Un
{
	char c[5];//5
	int i;//4
};

int main() 
{
	printf("%zd\n", sizeof(union Un));
	return 0;
}
//下面输出的结果是什么？
答案是8

注意：此处的数组相当于放了五个char类型变量，所以它的对齐数按1来算！！！所以该联合体的成员变量的最大对齐数是4，又因为当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍，所以该联合体的大小是最大对齐数4的整数倍为8。

烧鸡配油茶

关注

40
点赞
踩
36

收藏

觉得还不错? 一键收藏
17
评论
【C语言】详解自定义类型：结构体，枚举，联合

C语言中有很多内置的数据类型例如:int double ...等等。但我们在现实中有很多复杂对象需要描述。C语言中描述复杂对象的方式分别有结构体，枚举，联合，本期博客就让我们一起学习它们吧！有了结构体类型，那如何定义变量，其实很简单。代码示例：int x;int y;}p1;//声明类型的同时定义变量p1//定义结构体变量p2//初始化：定义变量的同时赋初值。struct Stu //类型声明//名字int age;//年龄//初始化int data;//结构体嵌套初始化。
复制链接

扫一扫

专栏目录