【c语言】自定义类型（struct篇）

SuhyOvO

已于 2024-04-01 15:06:00 修改

阅读量1.3k

点赞数 1

分类专栏： C语言文章标签： c语言数据结构算法

于 2022-10-11 09:09:04 首次发布

本文链接：https://blog.csdn.net/Z1tai/article/details/127214736

版权

C语言专栏收录该内容

14 篇文章 1 订阅

订阅专栏

文章目录

一、结构体的声明
二、结构体大小计
- 2.1如何计算呢？
- 2.2位段

基本定义：结构体通俗讲就像是打包封装，把一些有共同特征（比如同属于某一类事物的属性，往往是某种业务相关属性的聚合）的变量封装在内部，通过一定方法访问修改内部变量。具体一点说，结构体是让一些很散的数据变得很整，不管是网络传输，还是函数传参，还是为了便于你肉眼管理。

一、结构体的声明

1.1 结构的基础知识

结构体是一些数据的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2 结构体的声明

1. 只有结构体定义，然后再结构体创建变量：

struct Student{         //声明结构体
    char name[20];      //姓名
    int num;            //学号
    float score;        //成绩
};
struct Student stu1;    //定义结构体变量

2.结构体变量的定义也可以与结构体的声明同时，这样就简化了代码：


struct Student{        
    char name[20];       
    int num;             
    float score;         
}stu1;

3.匿名结构体类型：

struct
{
 int a;
 char b;
 float c; 
 }x;

匿名结构体有且只能在项目中使用一次，而且要注意的是这样的方式虽然简单，但不能再次定义新的结构体变量了。

4.typedef修饰的结构体以及结构的自引用

typedef struct Node
{
 int data;
 struct Node* next; 
 }Node;//将typedef struct Node简化成Node

Node next1;
struct Node next2; //其实next1和next2都可以创建结构体

其实这里面涉及到结构的自引用的方法

看下面这段代码：

struct Node
{
 int data;
 struct Node next;
};

这段代码能运行吗？

在这里插入图片描述显然是不能的，这种声明是错误的，因为这种声明实际上是一个无限循环，成员next是一个结构体，b的内部还会有成员是结构体，依次下去，无线循环。在分配内存的时候，由于无限嵌套，也无法确定这个结构体的长度，所以这种方式是非法的。

正确的方式：

struct Node
{
 int data;
 struct Node* next;
};

1.3结构体变量的定义和初始化

有了结构体类型，那如何定义变量，其实很简单。接下来我直接上代码：

普通结构体：

struct Point
{
 int x;
 int y; }p1; //声明类型的同时定义变量p1
 
struct Point p2; //定义结构体变量p2
//初始化：定义变量的同时赋初值。
struct Point p3 = {1, 2};

struct Stu        //类型声明
{
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化


struct Node
{
 int data;
 struct Point p;
 struct Node* next; 
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化

struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

结构体数组：
和普通数组差不多

//结构体中数组变量定义方法
struct stu{
        int array[3];
        int age;
};
//对于数组和变量同时存在的情况，有如下定义方法：
        struct test student[3] =      {{{66,77,55},18},
                                        {{44,65,33},19},
                                        {{46,99,77},17}};
//特别的，可以简化成：
        struct test student[3] =       {{66,77,55,18},
                                        {44,65,33,19},
                                        {46,99,77,17}};

结构体指针：

struct Student
{
	char cName[20];
	int number;

}student1={"xiaoming",666};

int main() {

	struct Student* p;
	p = &student1;
	printf("%s %d", p->cName, p->cName);//结构体指针访问数据
	
}

用结构体指针变量访问结构体变量成员有以下两种方式：

(*p).cName //这里的括号不能少
p->cName

二、结构体大小计

2.1如何计算呢？

首先得掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
（ VS中默认的值为8）
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

那我们直接看题吧，试试计算结构体大小：

struct S1
{
	char c1;
	int i;
	char c2;
};
//printf("%d\n", sizeof(struct S1));

这个结构体大小是12，怎么算的呢？

在这里插入图片描述
首先c1与vs的对齐数比较，c1的对齐数为1，所以可以放在1的倍数的位置。
其次i与vs的对齐数比较，i的对齐数为4，所以可以放在4的倍数的位置，只有4才能放，123位置的空间全浪费了。
最后c2与vs的对齐数比较，c2的对齐数为1，所以可以放在1的倍数的位置。
结构体总大小为最大对齐数4（每个成员变量都有一个对齐数）的整数倍，所以只能又浪费3个空间，凑到4的倍数12的位置。

那我们再来看一个

struct S2
{
 char c1;
 char c2;
 int i;
};
printf("%d\n", sizeof(struct S2));

这个结构体大小是8
在这里插入图片描述
同上可知，c1和c2放在0和1内存上，由于i的原因，2和3的空间被浪费了，所以i放在4-8的空间上。

那我们再来看看S1和S2结构体的区别：
S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。从大小可以，S2用的空间比S1少，但S1和S2类型的成员一模一样，说明S2空间效率更好。
因此我们设计结构体的时候，尽量把数据从小到大排放，让占用空间小的成员尽量集中在一起，这样能使空浪费减少。

为什么存在内存对齐?

平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：
结构体的内存对齐是拿空间来换取时间的做法

补充一点，如何修改vs默认对齐数

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认

让我看一起来看个题吧！

写一个宏，计算结构体中某变量相对于首地址的偏移，并给出说明

这个宏是不是跟结构体地址对齐原理是一样的，其实就是offsetof 宏的实现。

#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE*)0)->MEMBER)

计算结构体成员的偏移，有些自有代码里也会手写这样的代码，实际上这个函数是标准实现的。实际上如果我们浏览 ANSI C 编译器的标头文件，将在 stddef.h 中遇到这样奇怪的宏。这个红具有可怕的声明。此外，如果您查阅编译器手册，您会发现一个无益的解释，上面写着如下：
offsetof() 宏返回结构或联合复合中元素名称的偏移量。这提供了一种可移植的方法来确定偏移量。

2.2位段

什么是位段？
位段又称为位域。C语言中没有专门的位段类型，位段的定义要借助于结构体，即以二进制位为单位定义结构体成员所占存储空间。从而就可以按“位”来访问结构体中的成员，这一功能是很有用的。某些设备接口之间传输信息是以字节为单位的，字节中的不同位代表不同的控制信号，使用中常常需要单独置值或清零。又如C语言中没有逻辑量，是用0代表“假”，非0代表“真”。实际只需一个二进制位就可存储。利用位段就可以在一个字节中存放几个逻辑量。

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。

这个就是位段：

str**加粗样式**uct A {
 char _a:3;
 char _b:4;
 char _c:5;
 char _d:4;
};
printf("%d\n", sizeof(struct A));

那位段A的大小是多少？3个字节

怎么算的呢?
在这里插入图片描述
首先我们来看看，char a:2这个语句啥意思。这个就是给a分配两个比特位的空间。把a两个比特位的二进制倒着存于char类型的空间内。
而b呢，由于3+4小于8所以不用创建新的内存空间，接着a前面继续存放。
但c，3+4+5大于一个字节所有空间，所以放不下c了，得重新再开辟一个新空间，倒着存放c的二进制。
同理，d也得重新开辟一个新空间存放。
总计，使用了三个字节的空间。

位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在

位段的应用
在这里插入图片描述