从头开始：自定义类型入门指南（结构体、位段、枚举、联合）

清水加冰

已于 2023-10-14 14:10:47 修改

阅读量2.1k

点赞数 8

分类专栏： C语言进阶文章标签： c语言开发语言其他经验分享

于 2023-07-17 20:19:49 首次发布

本文链接：https://blog.csdn.net/2202_75605090/article/details/131751415

版权

C语言进阶专栏收录该内容

13 篇文章 4 订阅

订阅专栏

前言

在编程中，数据类型是非常重要的。然而，有时候标准的数据类型可能无法满足我们的需求。在这种情况下，自定义类型可以帮助我们更好地组织和表示数据。

结构体

结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

结构体类型的声明

结构体格式：

struct 结构体标签名
{
  member-list;//  成员列表
}variable-list;// 变量列表;

我们举个例子：

例如：我们使用结构体描述一个学生的基本信息

struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}s1;

name[20]，age，sex[5]，id[20]，都是结构体成员，s1是结构体变量，指代某个学生，如学生1、学生2……

在结构体声明时还存在特殊的声明：在声明结构的时候，可以不完全的声明

例如：

struct
{
int a;
char b;
float c;
}x;

struct
{
int a;
char b;
float c;
}a[20], *p;

上述的两个结构在声明的时候省略掉了结构体标签（tag）

那么这里思考一下，p是第二个匿名结构体的指针，两个匿名结构体结构体成员相同，那么，p等于&x是否合法？

虽然两个匿名结构体几乎相同，但编译器会把上面的两个声明，当成完全不同的两个类型。所以是非法的。

注意：匿名结构体是一种方便的定义结构体变量的方式，但需要注意作用域和命名冲突等问题。

匿名结构体只能在定义它的作用域内使用。这意味着如果需要在其他函数或文件中使用该结构体，就需要定义一个具有名称的结构体类型。
匿名结构体只能在定义它的作用域内使用。这意味着如果需要在其他函数或文件中使用该结构体，就需要定义一个具有名称的结构体类型。
匿名结构体不能被继承。由于没有名称，因此无法通过其他结构体继承它的成员。
匿名结构体的定义通常用于临时变量或局部变量。如果需要定义一个全局变量或持久化变量，最好还是使用具有名称的结构体类型。
如果在一个结构体中包含多个匿名结构体，那么它们之间的成员不能重名。否则会导致编译错误。

匿名结构体在使用时是一次性的，使用一次之后就无法被使用，所以在使用时慎用。

结构体的自引用

结构体的自引用是指结构体中的一个成员引用了结构体本身。接下来我们来看以下代码：

struct Node
{
int data;
struct Node next;
};

这样是否可行？如果可行那sizeof（struct Node）又是多少呢？

这样其实是不可行的，为什么呢？

自引用的结构体在编译阶段是无法确定大小的，因为结构体的大小取决于其成员的大小，而成员又依赖于结构体的大小。这样会导致一个无限循环的问题。

为了解决这个问题，可以使用指针或引用来间接引用结构体本身。这样可以避免结构体大小的无限循环问题。

正确的解引用方式为：

struct Node
{
int data;
struct Node* next;
};

那么接下来我们再来看看这段代码：

typedef struct
{
int data;
Node* next;
}Node;

typedef可以对结构体进行重命名。这样是否可行？

答案是不行，在结构体定义中，使用Node* next来声明成员是不允许的，因为在结构体定义中，Node尚未被定义，编译器无法确定Node的大小。这将导致编译错误。

为了解决这个问题，可以使用结构体的前向声明来声明成员。可以将结构体的定义和typedef分开，先声明结构体的名称，然后再定义结构体的成员。

我们可以这样定义：

typedef struct Node Node;

struct Node {
    int data;
    Node* next;
};

typedef struct Node
{
int data;
struct Node* next;
}Node;

这两种形式都是可以的。

结构体变量的定义和初始化

结构体变量定义

结构体的变量有两种方式：

struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

初始化

我们可以定义结构体变量的同时进行初始化：

struct Point p3 = {x, y};

初始化时依据变量在结构体中的顺序依次进行赋值，例如：

struct Stu     //类型声明
{
char name[15];//名字
int age;    //年龄
};
struct Stu s = {"zhangsan", 20};//初始化

初始化的顺序与结构体成员顺序对应。

当然我们还可以结构体嵌套进行初始化，例如：

struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化


struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

结构体大小

我们已经了解了结构体的基本使用，那么结构体如何计算大小呢？

这里就要引进新的内容——结构体内存对齐

这也是特别热门的考点。

首先我们要先掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处
对齐数是编译器默认的一个对齐数与该成员大小的较小值。

VS中默认的值为8 ，gcc中无默认值。对齐数就是结构体成员的自身大小。

结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整
体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

这些规则怎么理解呢？如下图：

第一个成员在与结构体变量偏移量为0的地址处，例如结构体struct S1，第一个成员c1为char类型，在偏移量为0的位置，大小占一个字节。

对齐数是编译器默认的一个对齐数与该成员大小的较小值。第二个结构体变量为int类型，大小是4个字节，而我所使用的vs默认对齐数8，选择较小值，所以i的对齐数应为4。

其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处，i的对齐数是4，所以i要对齐到4的整数倍地址处，也就是4地址处，这是c1与i之间就会浪费3个字节的空间（这3个空间不存储数据）。

结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。第三个变量是c2，char类型占一个字节，对齐到1的整数倍地址处，也就紧挨着i，此时三个变量占了9个字节，但结构体的大小必须是结构体成员最大对齐数的整数倍，这里的9显然不是4的整数倍，所以系统会继续向后扩展“浪费”三个字节的空间到12个字节。

所以结构体struct S1占12个字节。

如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整
体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

struct S3
{
double d;
char c;
int i;
};

struct S4
{
char c1;
struct S3 s3;
double d;
};

我们来看一下它们两个的结构体大小。

结构体struct S3第一个成员d大小是8，默认对齐数是8，选较小的数作为对齐数，相等就选8作为对齐数，在偏移量为0的位置向后8个字节都是d的空间范围。

第二个成员c，char类型对齐数是1，对齐位置也是1的倍数，所以紧挨着d，

第三个变量i，int类型占4个字节，对齐数是4，对齐位置需要是4的倍数开始，d+c占了9个字节的空间，i的对齐位置必须是4的倍数，所以向后扩展3个字节后i开始对齐。

d+c+i总共占了16个字节，刚好所有成员对齐数最大值8的整数倍，所以16就是struct S1的大小。

我们继续看struct S4，第一个成员c1占一个字节对齐数是1，在偏移量为0的位置。

第二个成员是结构体变量，类型为struct S3，前边我们计算出struct S3占16个字节，struct S3中最大的对齐数是8，嵌套的结构体对齐到自己的最大对齐数的整数倍处，也就是偏移量为8的位置处开始向后的16个字节的范围都是s3所占空间。

第三个成员d，类型为double类型占8个字节，对齐数是8，所以对齐位置要是8的倍数，也就是紧挨着s3的位置，向后8个字节的范围。

c1+s3+d总共占了32个字节的空间，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。所有对齐数最大的是8，所以32就是struct S4的大小。

为什么存在内存对齐?

平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

性能原因：

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法

除此之外我们还可以修改默认对齐数

#pragma 这个预处理指令，这里我们使用这个指令，可以改变我们的默认对齐数。

例如：

#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认

结构在对齐方式不合适的时候，我们可以自己更改默认对齐数。

结构体传参

结构体传参有两种方式直接上代码：

struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};

//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}

//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}

int main()
{
print1(s);  //传结构体
print2(&s); //传地址
return 0;
}

这两种方式哪个更好呢？

答案是printf2。函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能
的下降。
结论：结构体传参的时候，要传结构体的地址。

位段

什么是位段

位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 。
位段的成员名后边有一个冒号和一个数字。

例如：

struct A
{
int a:2;
int b:5;
int c:10;
int d:30;
};

A就是一个位段类型。
那位段A的大小是多少？

printf("%d\n", sizeof(struct A));//8

A的大小是8个字节，这是怎么回事呢？变量：后边的数字表示该变量所需的比特位（二进制位）。

位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

例如：

a占2个二进制位，b占5个二进制位，c占10个二进制位，那么系统在分配空间时就会分配一个整形空间给它们。

而d是30个二进制位，1个整形还剩余15个二进制位不够，那么此时系统会再次开辟一个整形空间，至于d是继续沿用剩余的15位空间，还是直接在新开的空间里存储，这里就涉及了很多不确定因素，编译器不同位段开辟的空间及使用的方式也会各不相同，所有位段是不跨平台的。

这里及涉及到位段跨平台问题，主要因素：

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

位段的应用：

可以尽可能的节省空间。

枚举

枚举就是把可能的取值一一列举。

在我们的日常生活中也有很多例子：如性别，月份，星期等。

枚举的定义

enum Color//颜色
{
RED,
GREEN,
BLUE
};

enum Color 就是是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。

enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
int main()
{
enum Color c=RED;
return 0;
}

枚举的优点

那枚举有什么用呢？我们可以使用 #define 定义常量，为什么非要使用枚举？枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
便于调试
使用方便，一次可以定义多个常量

枚举的使用

enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。

那这样是否可行呢？clr = 5，答案是不可行，枚举有类型检查，在c++编译时会出现报错，显示整形不能用于初始化枚举类型。

联合（共用体）

联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）

例如：

//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));//4

c和i公用同一块空间。

通过调试我们也可以观察到：

它们的地址相同。由此我们就可以推断出内存分布：

使用c时就访问蓝色空间，使用i时就访问整块空间。我们通过程序感受一下：

union Un
{
	char c;
	int i;
};

union Un un;
int main()
{
	un.i = 0x11223344;
	un.c = 0x55;
	printf("%x\n", un.i);//11223355
	return 0;
}

i正常情况下应该是11223344，而使用联合，将c赋值0x55，由于它们共用同一块空间，所以在c赋值时就自动覆盖了i的后两位（程序运行在小端机器上）。

联合大小的计算

规则如下：

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍

例如：

union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));//8
printf("%d\n", sizeof(union Un2));//16

总结

希望本文能够帮助你更好地理解自定义类型，并且能够在你的编程之路上起到一定的帮助作用。最后，感谢阅读！

清水加冰

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
9
评论
从头开始：自定义类型入门指南（结构体、位段、枚举、联合）

在编程中，数据类型是非常重要的。然而，有时候标准的数据类型可能无法满足我们的需求。在这种情况下，自定义类型可以帮助我们更好地组织和表示数据。int x;int y;}p1;//声明类型的同时定义变量p1//定义结构体变量p2位段的成员必须是 int、unsigned int 或signed int。位段的成员名后边有一个冒号和一个数字。int b:5;int c:10;int d:30;A就是一个位段类型。那位段A的大小是多少？//8。
复制链接

扫一扫