自定义类型的这些知识你知道吗？C语言超硬核结构体枚举联合体画图+文字详细讲解

最新推荐文章于 2021-08-24 20:57:32 发布

小赵小赵福星高照～

最新推荐文章于 2021-08-24 20:57:32 发布

阅读量633

点赞数 1

分类专栏： C语言文章标签：自定义类型结构体联合体枚举

本文链接：https://blog.csdn.net/attemptendeavor/article/details/118913867

版权

C语言专栏收录该内容

41 篇文章 7 订阅

订阅专栏

自定义类型详解(结构体+枚举)

数据经常以成组的形式存在。例如，一本书必须指定书名，书的价格，书号。如果这些值能够存储在一起，访问起来会很简单。但是如果这些值的类型不同，它们无法存储在数组当中，在C语言中，使用结构可以把这些不同类型的值存储在一起。

接下来博主将以以下内容进行自定义类型的讲解：

结构体

结构体的基础知识

数组是一组相同类型的元素的集合，结构体也是一些值的集合，这些值称为它的成员，结构的每个成员可以是不同类型。

有关结构体的一些基础知识，博主的另一篇文章也介绍了结构体的基础知识，有兴趣可以看一下：结构体

结构体的声明

在声明结构体时，我们需要列出它的所有成员。这个列表包括每个成员的类型和名字

struct Book
{
    char name[20];
    int price;//成员变量
    char id[10];
}b4,b5,b6;//结构体变量，全局变量
int main()
{
    struct Book b1;//b1,b2,b3为局部变量
    struct Book b2;
    struct Book b3;
    return 0;
}

struct是结构体关键字。Book是是结构体的名字，也是标签，大括号里面声明的它的成员，这个声明创建了b4，b5，b6三个结构体变量，它们都包含三个成员：两个字符数组，一个整数，注意它们在声明时创建时是全局变量，而在main函数里面创建的b1，b2，b3变量为局部变量。

结构体的特殊声明

在声明结构体时我们可以匿名结构体类型，将标签省略。请看下面代码：

//匿名结构体类型，将标签省略
struct 
{
    char c;
    int i;
    char ch;
    double d;
}s;//结构体变量
struct 
{
    char c;
    int i;
    char ch;
    double d;
}* ps;//结构体变量
int main()
{
    ps=&s;//error，是不可以的
    //在编译器看来，虽然你们的成员变量是一样的，但编译器认为它们是不一样的结构体类型
    return 0;
}

我们匿名声明结构体时，需要注意：在编译器看来，虽然你们的成员变量是一样的，但编译器认为它们是不一样的结构体类型，这两个声明被编译器当成了两种截然不同的类型因此变量s和变量ps的类型不同，所以ps=&s是非法的。

注意：匿名声明结构体，它只能在声明时创建结构体变量

结构体的自引用

一个结构体的成员可以是一个结构：

struct A
{
    int i;
    char c;
};
struct B
{
    char c;
    struct A sa;
    double d;
};

那么在结构内部包含一个类型为该结构体本身的成员是否合法呢？

struct C
{
  	int d;
    struct C c;//这样是不行的 
};

这种自引用是不正确的，因为成员是c一个完整的结构，其内部还包括它自己的成员c，这第2个成员又是另一个完整的结构，它还将包括它自己的成员c，这样重复下去永无止境。就像一个永远不会终止的递归程序。

正确的结构体自引用如下：

 struct C
 {
     int d;
     struct C* c;//正确的结构体的自引用
 };

c是一个指针，它指向的元素类型是struct C，它所指向的是同一种类型的不同结构。

注意下面这个陷阱：

typedef struct
{
    int d;
    Node* c;
}Node;//不正确，这里typedef类型重命名时，需要成员变量的类型确定了，才会重命名,所以新的名字在结构体成员里是不能直接用的

这个声明的目的是为了类型重命名为Node，但是，它失败了，为什么呢？是因为类型名直到声明的末尾才定义，所以在结构声明的内部它还没有定义。

我们可以定义一个结构标签来声明c，这样就可以了：

typedef struct Node_Tag
{
    int d;
    struct Node_Tag * c;
}Node;

结构体变量的定义和初始化

结构的成员可以是标量、数组、指针、甚至是其他结构体。

给结构体变量初始化时与数组相似，需要用{}大括号，这些初始化的值根据结构成员列表的顺序写出。

struct S
{
    char ch;
    int i;
}s1,s2;
struct A
{
    int i;
    char c;
    struct S s;
};
int main()
{
    struct S s3={'a',20};
    struct A a={10,'b',{'b',30}};
    printf("%d %c %c %d",a.i,a.c,a.s.ch,a.s.i);
    return 0;
}

结构体内存对齐

我们首先看下面的代码

struct S
{
    int i;//4
    char c1;//1
    char c2;//1
};
#include<stdio.h>
int main()
{
 	struct S s={0};
    printf("%d\n",sizeof(s));
    return 0;
}

s所占的空间大小是多少呢？答案是8个字节

为什么呢？一个int类型两个char类型不应该是6字节吗？

这里就有关于结构体大小的一个规则，结构体的内存对齐：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
linux-没有默认对齐数的概念
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所
有最大对齐数（含嵌套结构体的对齐数）的整数倍。

上面结构体大小的解释：

//练习1
struct S1
{
    char c1;
    int i;
    char c2;
};
	printf("%d\n", sizeof(struct S1));
//练习2
struct S2
{
    char c1;
    char c2;
    int i;
};
	printf("%d\n", sizeof(struct S2));
//练习3
struct S3
{
    double d;
    char c;
    int i;
};
	printf("%d\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
    char c1;0
    struct S3 s3;8-23
    double d;24-31
};
	printf("%d\n", sizeof(struct S4));

练习1讲解：

练习2讲解：

练习3讲解：

练习4讲解：

为什么存在内存对齐？

平台原因(移植原因)： 不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因： 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器
需要作两次内存访问；而对齐的内存访问仅需要一次访问。

看下面这个结构体，我们举例说明一下为什么要内存对齐

struct S
{
    char c;
    int i;
}s;

假设一个计算机一次访问4个字节，第一种访问一次就能完整的访问到i，第二种首先访问c和i的前三个字节，然后访问i的第四个字节和后面三个字节。需要通过两次访问才能将i完全访问，这时有人可能会疑惑，我们为什么不直接找到i直接访问i的四个字节呢？别忘了我们的第一个原因：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

结构体的内存对齐是拿空间来换取时间的做法。

那我们在设计结构体的时候，我们既要满足对齐，又要节省空间，我们如何做到呢？

让空间小的成员尽量集中在一起

例如：

//例如：
struct S1
{
    char c1;
    int i;
    char c2;
};
struct S2
{
    char c1;
    char c2;
    int i;
};

上面定义的结构体S2就比S1省空间

修改默认对齐数

那么我们可不可以修改默认对齐数数呢？答案是可以的。

#include<stdio.h>
struct S
{
    char c1;
    int i;
    char c2;
};
int main()
{
    printf("%d\n",sizeof(struct S));//12
    return 0;
}

不修改默认对齐数时，上面代码中的结构体大小为12。

如何修改默认对齐数呢？

//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)

这样我们就把我们的默认对齐数修改为2了。

#include<stdio.h>
//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)
struct S
{
    char c1;0
    int i;2-5
    char c2;6
        7
};
int main()
{
    printf("%d\n",sizeof(struct S));//8
    return 0;
}

修改默认对齐数后，结构体大小变成了8

结构体传参

值传递：

struct S
{
    int date[1000];
    int num;
};
struct S s={{1,2,3,4},1000};
void print1(struct S s)
{
    printf("%d\n",s.num);
}
int main()
{
    print1(s);//结构体地址传递
    return 0;
}

地址传递：

struct S
{
    int date[1000];
    int num;
};
struct S s={{1,2,3,4},1000};
void print2(struct S* s)
{
    printf("%d\n",s->num);
}
int main()
{
    print2(&s);//结构体地址传递
    return 0;
}

上面的print1和print2函数哪个好一些呢？

答案是print2。原因：

函数传参的时候，参数是需要压栈的。如果传递一个结构体对象的时候，结构体过大，参数压栈的系统开销比较大，所以会导致性能的下降。

结论：结构体传参的时候，传结构体的地址好一些。

位段

关于结构，我们还需要提到它们实现位段的能力。位段的声明和结构类型，但它的成员是一个或多个位的字段。这些不同长度的字段实际上存储于一个或多个整形变量中。

什么是位段

位段的声明和结构是类似的，但是有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。这个整数指定该位段所占用的位的数目

位段的声明

struct A
{
  	int _a:2;//_a成员占两个bit位
  	int _b:5;//_b成员占5个bit位
    int _c:10;//_c成员占10个比特位
    int _d:30;//_d成员占30个bit位
};

A就是一个位段类型，那位段A的大小是多少呢？

#include<stdio.h>
struct A
{
    int _a : 2;
    int _b : 5;
    int _c : 10;
    int _d : 30;
};
int main()
{
    printf("%d\n", sizeof(struct A));
    return 0;
}

首先_a是int类型，开辟4个字节的空间，_a占了2bit，_b占了5bit，_c占了10bit，此时32个bit位还剩下15个bit位，已经放不下_d(30bit)了，所以我们再开辟4个字节的空间，将_d放在新开辟的空间中，所以我们A位段的大小为8字节。那么我们能不能利用空间，将_d的15个bit位放入刚开始开辟的空间中去呢？这是不确定的，当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

位段的内存分配

位段的成员可以是 int ，unsigned int ，signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

下面我们看一个例子：

struct S
{
    char a : 3;
    char b : 4;
    char c : 5;
    char d : 4;
};
int main()
{
    struct S s = { 0 };
    s.a = 10;
    s.b = 12;
    s.c = 3;
    s.d = 4;
    return 0;
}

代码图解：

我们调试发现结构体内存中果然是这样存储的：

注意：

注重可移植的程序应该避免使用位段。由于下面这些与实现有关的依赖性，位段在不同的编译器或者系统中可能会有不同的结果

int被当作有符号数还是无符号数是不确定的
位段中位的最大数目；好多编译器把位段成员的长度限制在一个整型值的长度以内，一个能够运行在32位机器上的位段，可能在16位机器上是无法运行的
位段中的成员的内存是从左向右分配还是从右向左是不确定的
当一个位段结构包含两个位段成员，第二个位段成员比较大，无法容纳于第一个位段成员存储空间剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

枚举

枚举的优点

我们为什么使用枚举呢？

增加代码的可读性和可维护性
和#define定义的标识符比较，枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

源文件是经过怎么样的一个过程生成可执行文件的呢？

源文件在经过编译链接后得到可执行文件。#define定义的常量在预编译阶段处理，我们在调试时，常量已经全部被处理了，不便于调试，而枚举是便于调试的。

枚举类型的声明

枚举顾名思义就是一一列举

枚举是 C 语言中的一种基本数据类型，它可以让数据更简洁，更易读。

枚举语法定义格式为：

enum 枚举名
{
    枚举元素1,
    枚举元素2,
    ...
};

首先我们举个例子，比如：一星期有7天，如果不用枚举，我们需要使用 #define 来为每个整数定义一个别名：

#define MON  1
#define TUE  2
#define WED  3
#define THU  4
#define FRI  5
#define SAT  6
#define SUN  7

接下来我们看一看枚举的方式：

enum DAY
{
 	MON=1,TUE,WED,THU,FRI,SAT,SUN  
};

这样我们发现代码变得更加简洁了。

注意：

第一个枚举成员的默认值为整型的 0，后续枚举成员的值在前一个成员上加 1。我们如果把第一个枚举成员的值定义为 1，第二个就为 2，以此类推。

我们可以在定义枚举类型时可以改变枚举元素的值：

enum season {spring, summer=3, autumn, winter};

没有指定值的枚举元素，其值为前一元素加 1。也就说 spring 的值为 0，summer 的值为 3，autumn 的值为 4，winter 的值为 5

枚举变量的定义

前面我们讲的是枚举类型的声明，接下来我们看看如何定义枚举变量

我们有三种方式来定义枚举变量:

先定义枚举类型，再定义枚举变量

enum DAY
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
};
enum DAY day;

注意：

enum DAY day = 2;//这个代码在c文件可以编译成功，但是在c++文件中不能成功

c文件可以编译成功，但是在c++文件中不能成功，2是int类型，int类型是不能赋给DAY类型，c++检查更加严格。

定义枚举类型的同时定义枚举变量

enum DAY
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;

省略枚举名称，直接定义枚举变量

enum
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;

枚举在 switch 中的使用

#include <stdio.h>
#include <stdlib.h>
int main()
{
 
    enum color 
    {
        red=1,
        green,
        blue 
    };
    enum  color favorite_color;
 
    //用户输入数字来选择颜色
    printf("请输入你喜欢的颜色: (1. red, 2. green, 3. blue): ");
    scanf("%u", &favorite_color);
 
    //输出结果
    switch (favorite_color)
    {
    case red:
        printf("你喜欢的颜色是红色");
        break;
    case green:
        printf("你喜欢的颜色是绿色");
        break;
    case blue:
        printf("你喜欢的颜色是蓝色");
        break;
    default:
        printf("你没有选择你喜欢的颜色");
    }
    return 0;
}

联合

联合也是一种特殊的自定义类型，这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

联合体的声明和定义

联合类型的声明

//联合类型的声明
union Un
{
    char c;
    int i;
};

联合变量的定义

union Un u;

那么联合变量的大小是多少怎么计算呢？

//联合类型的声明
union Un
{
    char c;//1
    int i;//4
};
int main()
{
    ///联合变量的定义和初始化
    union Un u={0};
    printf("%d\n",sizeof(u));//计算联合变量的大小
    return 0;
}

我们发现这个联合变量大小为4，char是1字节，int为4字节，不应该至少是5字节吗？为什么是4呢？它是怎么计算的呢？我们继续往下看。

我们首先打印下面的地址：

printf("%p\n", &u);
printf("%p\n", &(u.c));
printf("%p\n", &(u.i));

我们发现这些地址都是相同的，所以它们是共用同一块内存的。

所以联合体也叫共用体。

我们接着往下看：

联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。同一时间只能使用一个成员

联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

union Un1
{
    char c[5];
    int i;
};
union Un2
{
    short c[7];
    int i;
};
//下面代码输出的结果是什么？
int main()
{
    printf("%d\n", sizeof(union Un1));
    printf("%d\n", sizeof(union Un2));
}

Un1大小的解释：

Un2大小的解释：

接下来我们来看一道笔试题：

一道百度笔试题

判断系统是大端存储还是小端存储

之前在讲解大小端时候说过这个笔试题，如果你不了解大小端的话，先去看一下博主的大小端讲解：( 深度剖析数据在内存中的存储之整形在内存中的存储、以及大小端介绍)。

利用指针类型的作用判断

int judge_sys()
{
	int a = 1;
	//小端 01 00 00 00
	//大端 00 00 00 01
	return *((char*)&a);//强制类型转换为char*，然后解引用访问了a的一个字节
	//是1就为小端，是0就为大端
}
int main()
{
	if (judge_sys())
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

return *((char*)&a);

强制类型转换为char，然后解引用访问了a的一个字节
是1就为小端，是0就为大端

利用联合判断

int judge_sys()
{
	union Un
	{
		int a;
		char ch;
	}u;
	u.a = 1;
	return u.ch;
	//是1就为小端，是0就为大端
	//小端 01 00 00 00
	//大端 00 00 00 01
}
int main()
{
	if (judge_sys())
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

利用联合判断时，给a赋值1，因为a和ch是共用内存的，所以给a赋值，ch也会发生改变，而且在内存中ch与a的第一个字节内容是相等的，a的第一个字节内容又取决于系统是大端存储还是小端存储，大端存储时，a的第一个字节内容为00，小端存储时，a的第一个字节内容为01，所以我们返回联合体中的ch成员，就能够判断是大端存储还是小端存储。

博主水平有限，如有错误，还望指正！欢迎大家学习讨论！记得点赞评论收藏哦！

小赵小赵福星高照～

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
10
评论
自定义类型的这些知识你知道吗？C语言超硬核结构体枚举联合体画图+文字详细讲解

自定义类型详解(结构体+枚举)数据经常以成组的形式存在。例如，一本书必须指定书名，书的价格，书号。如果这些值能够存储在一起，访问起来会很简单。但是如果这些值的类型不同，它们无法存储在数组当中，在C语言中，使用结构可以把这些不同类型的值存储在一起。接下来博主将以以下内容进行自定义类型的讲解：文章目录自定义类型详解(结构体+枚举)结构体结构体的基础知识结构体的声明结构体的特殊声明结构体的自引用结构体变量的定义和初始化结构体内存对齐为什么存在内存对齐？修改默认对齐数结构体传参值传递：地址传递：位段什么是
复制链接

扫一扫