C语言 || 结构体进阶

仙奶本奶

已于 2024-07-03 10:31:48 修改

阅读量1k

点赞数 24

分类专栏： C语言文章标签： c语言

于 2024-02-05 17:09:21 首次发布

本文链接：https://blog.csdn.net/2302_80191861/article/details/136017162

版权

C语言专栏收录该内容

7 篇文章 0 订阅

订阅专栏

如何做到在设计结构体时，既满足对齐，又节省空间？

结构体的特殊声明

前置知识

C语言 || 结构体初阶-CSDN博客

int a = 0；//定义了一个整型变量a

我们都知道这是定义了一个int类型的变量a，那么有没有什么方法可以定义一个“书”类型呢？

描述一本书，需要书名，作者，出版社，定价等信息，在编译器中并没有“书”这种类型，这就需要结构体

struct Book //定义了一个书类型
{
    //成员变量
    char name[20]; //书名
    char writer[20]; //作者
    int price; //价钱
} book1，book2; //分号不能丢
 //创建了book1和book2两个对象

特殊的声明

在声明结构的时候，可以不完全的声明

struct //省略了类型名，匿名结构体类型
{
    int a;
    char n;
    double b;
}S; //直接利用匿名结构体类型创建了一个变量S

这就叫匿名结构体类型

知道了匿名结构体类型，现在出现了一个问题

以下代码合法吗？

struct 
{
    int a;
    char n;
    double b;
}S; 
struct 
{
    int a;
    char n;
    double b;
}* ps; //匿名结构体变量的指针
int main()
{
    ps = &S;
    return 0;
}

答：不合法，在编译器看来，虽然两个匿名结构体的成员一模一样，但是仍然被认为是不同的类型，因此指针变量ps不能存S的地址

匿名结构体使用的一次性

匿名结构体只在一个函数或一个小的作用域内被用来传递数据。因为它没有被命名，所以在一次使用后通常不会被再次使用，可以被视为一次性使用

#include <stdio.h>

int main() {
    // 初始化一个没有命名的结构体
    struct {
        char *name;
        int age;
    } person = {"Alice", 30};

    // 使用这个没有命名的结构体中的数据
    printf("Name: %s\n", person.name);
    printf("Age: %d\n", person.age);

    return 0;
}

在这个例子中，我们在 main 函数内部创建了一个结构体并直接初始化了它的成员 name 和 age，而没有为这个结构体类型取名。然后我们创建了一个这个结构体的变量 person 并打印了它的内容。这种结构体通常是一次性的，因为在其定义之外它是不可见的，不能够在其他地方重复使用

不可见：指的是不能再次创建相同的结构体类型实例，因为该类型没有全局识别的名称。这是匿名结构体的局限之一，在使用时需要留意 ,比如下述代码

#include <stdio.h>
int main() {   
    struct {
        char *name;
        int age;
    } person;
   
    struct person1;//error

    return 0;
}

不能在其他地方重新使用：如果你需要在你的程序的多个地方使用这个结构，你应该定义一个具有名字的结构体类型。这样，相同的结构体类型就可以在你的整个程序中重复使用，并且可以被函数等作为参数和返回类型所引用

#include <stdio.h>
int main() {   
    struct  identity //定义了一个身份类型
    {
        char *name;
        int age;
    } person;
   
    struct identity person1;
    struct identity person2;//创建了两个身份类型的变量person1和person2

    return 0;
}

结构的自引用

引入

在结构体初阶中我们知道，结构体的成员可以是另一个结构体

比如

struct A 
{
    char a;
    int b;
    short c;
};
struct B
{
    int k;
    struct A a; //结构体的成员是另一个结构体
    char h;
};

那么，在结构体中包含一个类型为该结构本身的成员是否可以呢？

struct day
{
    int year;
    struct day aday; //是否可行？
};

答：不可以，永远会嵌套自己，结构体成员包含一个类型为结构本身的成员是不现实的。那么如何进行正确的自引用呢？

正确的自引用

struct node
{
    int data;
    struct node* next;
};

为什么这样写呢？我们要引入数据结构的知识

链表

现在随机存放了1,2,3,4,5五个元素

5
			2
	1

		4		3

我们将每一个元素存放的位置称作节点，现在要将多个节点按照12345的顺序串起来，该如何实现呢？

为了使1的后面能找到2，我们把2的地址存到1的位置，以此类推，每一个节点都存放了数据和下一个节点的地址。（5的位置没有下一个节点，所以存放空指针NULL）

我们发现节点分为两部分

节点

数据域--存放数据指针域--存放下一个节点的地址

因此指针域应该是一个结构体指针

struct node
{
    int data;
    struct node* next; //struct node* 代表存放的下一个节点和本身的类型相同
};

这样就找到了同类型的下个节点（关于链表的实现会在数据结构中描述）

结构体内存对齐

引入

我们现在要讨论一个问题：计算结构体的大小

struct S
{
    char a;
    int b;
    char c;
};
int main()
{
    sizeof(struct S); //结果是多少？
    return 0;
}

要想计算这个结构体的大小，首先要知道结构体的对齐规则

结构体的对齐规则

1.第一个成员在与结构体变量偏移量为0的地址处

2.其他成员变量要对齐某个数字（对齐数）的整数倍的地址处

对齐数 = 编译器默认的一个对齐数与该成员大小的较小值 vs编译器中默认的对齐数是8

3.结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍

4.如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

我们一条一条细说奥，以下述代码为例计算结构体大小

struct s 
{
    char a;
    int b;
    char c;
};
int main()
{
    struct s s1={ 0 }; //创建了一个s类型变量s1，并把s中的a初始化为0，b和c为默认值
    //sizeof(s1)是多少呢？
}

这是一块内存空间

假如从这个位置开始开辟

1.第一个成员在与结构体变量偏移量为0的地址处



假如从这个位置开始开辟，则该位置偏移量为0，因此变量a存放在这个位置
偏移量为1
2
3
4
5
以此类推

2.其他成员变量要对齐某个数字（对齐数）的整数倍的地址处

对齐数 = 编译器默认的一个对齐数与该成员大小较小值，vs编译器中默认的对齐数是8

3.结构体总大小为最大对齐数的整数倍（每个成员变量都有一个对齐数）

首先我们来看怎么计算对齐数

struct s 
{
    char a;  //char类型占1个字节，vs默认对齐数是8，取较小值，因此该成员变量的对齐数是1
    int b;  //int类型占4个字节，vs默认对齐数是8，取较小值，因此该成员变量的对齐数是4
    char c; //由上得，该变量对齐数是1
};     //每个成员变量都有一个对齐数
int main()
{
    struct s s1={ 0 }; 
}

接下来要继续存放变量b，b是int类型，对齐数是4，要存放在4的整数倍的地址处，因此



0 a
1
2
3
4 b
5 b
6 b
7 b int占4个字节
8
9
10

接着存放变量c，c的对齐数是1，所有数都是1的整数倍，因此

0 a

1 未使用

2 未使用

3 未使用

4 b

5 b

6 b

7 b

8 c

由此图可知现在变量s1占了9个字节，但sizeof（s1）的结果真的是9吗？

这是因为第3点，结构体的大小为最大对齐数的整数倍

struct s 
{
    char a;  //对齐数是1
    int b;  //对齐数是4
    char c; //对齐数是1
};       //最大对齐数是4，因此结构体大小一定是4的整数倍
int main()
{
    struct s s1={ 0 }; 
}

因此答案是12，如图所示

0 a

1 未使用

2 未使用

3 未使用

4 b

5 b

6 b

7 b

8 c

9 未使用

10 未使用

11 未使用

这就是结构体变量s1在内存空间中的存储情况

练习：试着计算sizeof（struct A）的结果


struct A 
{
    double a;
    char b;
    int c;
}; //sizeof（struct A）是多少呢？

第一步：先计算每个成员变量的对齐数，将第一个成员变量存入偏移量为0的地址内


struct A 
{
    double a; //double占8个字节，vs默认对齐数为8，对齐数要取两者的较小值，因此该成员变量对齐数为8
    char b;    //对齐数为1
    int c;    //对齐数为4
};

假设从这开始存储，此处偏移量就为0，a变量就会存放在这里，又因为double占8个字节

0 a

1 a

2 a

3 a

4 a

5 a

6 a

7 a double占8个字节

接着存放char类型的变量b和int类型的变量c，要把他们存放到对齐数的整数倍地址上，如图

0 a

1 a

2 a

3 a

4 a

5 a

6 a

7 a

8 b

9 未使用

10 未使用

11 c

12 c

13 c

14 c int占4个字节

又因为结构体的大小是最大对齐数的整数倍，因此结果为16

4.如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

struct A 
{
    double a;
    char b;
    int c;
};
struct B
{    
    char d;
    struct A a;
    double e;
}s;   //sizeof(s)是多少呢？

0 假如从此处开始存储，此处偏移量为0，存放变量d

接着存放结构体变量a，我们由上述练习可知


struct A 
{
    double a; //对齐数为8
    char b;    //对齐数为1
    int c;    //对齐数为4
};

最大对齐数是8，该结构体占16字节，因此要把该结构体变量a存放在地址为8的整数处

0 d

1 未使用

2 未使用

3 未使用

4 未使用

5 未使用

6 未使用

7 未使用

8 a

9 a

10 a

11 a

12 a

13 a

14 a

15 a

16 a

17 a

18 a

19 a

20 a

21 a

22 a

23 a

接着存放double类型的变量e，对齐数是8，占8个字节

22 a

23 a

24 e

25 e

26 e

~~~~~~~~~

31 e

又因为结构体的大小是最大对齐数的整数倍

struct A 
{
    double a;
    char b;
    int c;
};
struct B
{    
    char d;    //对齐数是1
    struct A a;    //对齐数是8
    double e;    //对齐数是8
}s;   //最大对齐数是8，结构体变量大小是8的整数倍

答案是32

为什么存在内存对齐？

这个问题有两个原因

1.平台原因（移植原因）：不是所有的硬件平台都能访问任意地址上的任意数据；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常

2.性能原因：数据结构（尤其是栈）应该尽可能地在自然边界上对齐。原因是，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问

0
1
2
3
4
5
6
7
8
9

如：可能某些平台规定只能访问偏移量为4的倍数的地址，这就是平台原因

struct a
{
    char b;
    int c;
};

假设计算机一次读取4个字节

假设从此处开始存储，则此处偏移量为0

正确读法

假设计算机一次能读取4个字节，读取变量c，一次便可完成

如果是这样

读取变量c需要两次才能完成 ，这便是性能原因

总的来说，结构体的内存对齐是拿空间来换取时间的做法

如何做到在设计结构体时，既满足对齐，又节省空间？

方法1：让占用空间小的成员集中在一起

struct a1
{
    char a;
    int b;
    char c;
};
struct a2
{    
    char a;
    char c;
    int b;
};    //sizeof(struct a1)和sizeof(struct a2)的结果分别是多少？

答：a1和a2类型的成员一模一样，但是前者为12，后者为8，因为后者将char类型的成员变量放在一起，节省了空间

方法2：修改默认对齐数

使用#pragma这个预处理指令

#pragma pack(8) //修改默认对齐数为8
struct s
{
    char c1;
    int i;
    char c2;
};
#pragma pack() //取消设置的默认对齐数，还原为默认

那么下面这个结构体的大小是多少呢？

#pragma pack(2)    //修改默认对齐数为2
struct s
{
    char c1;
    int i;
    char c2;
};
#pragma pack()    //取消设置的默认对齐数，还原为默认

#pragma pack(2)    
struct  s
{
    char c1;    //char占1个字节，默认对齐数为2，取较小值，则该成员变量的对齐数为1
    int i;    //int占4个字节，默认对齐数为2，取较小值，则该成员变量的对齐数为2
    char c2;
}; //最大对齐数是2
#pragma pack()

如图所示

0 c1

1 未使用

2 i

3 i

4 i

5 i

6 c2

又因为结构体大小只能是最大对齐数的整数倍，因此该结构体大小为2的倍数，即为8

结构在对齐不合适的时候，我们可以自己修改默认对齐数

位段

位段的声明

位段的声明和结构体的声明是类似的，但有两个不同

1.位段的成员必须是int、unsigned int或signed int(也有char类型，因为char也是整型家族中的一员，在内存中存储字符时存放的是字符的ASCII值）

2.位段的成员名后边有一个冒号和一个数字

比如下面

struct A
{
    int a:2;
    int b:5;
    int c:10;
    int d:30;
}; //位段的每一个成员后边有一个冒号和一个数字
   //A就是一个位段类型

位段的大小

struct A
{
    int a:2;
    int b:5;
    int c:10;
    int d:30;
}; //sizeof（struct A）是多少呢？

数字的含义

先来解释一下后面这些数字的含义

struct A
{
    int a:2;    //a成员占2个bit位
    int b:5;    //b成员占5个bit位
    int c:10;    //c成员占10个bit位
    int d:30;    //d成员占30个bit位
};

位段成员的内存分配

然后我们来解释一下位段成员的内存分配

1.位段的成员可以是int、unsigned int或者是char（属于整型家族）类型

//一个例子
struct A
{
    int a:2;    //a成员占2个bit位
    int b:5;    //b成员占5个bit位
    int c:10;    //c成员占10个bit位
    int d:30;    //d成员占30个bit位
};

2.位段的空间上是按照需要以4个字节（int）或者1个字节（char）的方式来开辟的

//一个例子
struct A
{
    //首先开辟4个字节，32bit
    int a:2;    //a成员占2个bit位
    int b:5;    //b成员占5个bit位
    int c:10;    //c成员占10个bit位
    //32个bit装下了成员a，b，c，用了17bit，剩下15bit不能存储30bit的成员d
    //因此又开辟了4个字节（32bit）用来存放成员d
    int d:30;    //d成员占30个bit位
};

由上可知我们一共开辟了8个字节，所以sizeof（struct A）的答案就是8

我们现在出现了一个问题

//一个例子
struct A
{
    //首先开辟4个字节，32bit
    int a:2;    //a成员占2个bit位
    int b:5;    //b成员占5个bit位
    int c:10;    //c成员占10个bit位
    //32个bit装下了成员a，b，c，用了17bit，剩下15bit不能存储30bit的成员d
    //因此又开辟了4个字节（32bit）用来存放成员d
    int d:30;    //d成员占30个bit位
};

成员d的30bit是全部存放在新开辟的32bit中，还是将15bit存放在先前剩下的空间，再将17bit存放在后来开辟的32bit中

3.位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段

C语言标准没有规定，是否舍弃先前剩下的15bit ，在不同平台的实现方式可能不同

空间是如何开辟的？

好啦，我们再来举一个例子说说位段成员的空间是如何开辟的(vs编译器)

struct s
{
    char a:3;
    char b:4;
    char c:5;
    char d:4;
} s1 = { 10, 12, 3, 4 };

我们知道，位段的空间上是按照需要以4个字节（int）或者1个字节（char）的方式来开辟的，

该位段的成员都是char类型，所以按照1个字节的方式来开辟

struct s
{
    //首先开辟1个字节-8个bit，用来存放a和b，剩下1个bit不够存放占5个bit的c，因此
    char a:3;
    char b:4;
    //开辟1个字节-8个bit，用来存放c，剩下3个bit不够存放占4个bit的d，因此
    char c:5;
    //开辟1个字节-8个bit，用来存放d，剩下4个bit
    char d:4;
} ;
struct s s1 = { 0 };
s1.a = 10;
s1.b = 12;
s1.c = 3;
s1.d = 4;

如图所示

1.开辟1个字节，10的二进制是1010，占3个bit，取后三位先放在右侧（VS编译器中，位段成员在内存中从右向左分配）

00000010

2.12的二进制是1100，占4个bit，取4位接着放

01100010

3.剩下的1个bit不够存放c（c占5个bit），因此新开辟了1个字节-8个bit，用来存放3的二进制11，占5个字节，空位补0，因此存的是00011

01100010

00000011

4.剩下的3个bit不够存放d（d占4个字节），因此新开辟了1个字节-8个bit，用来存放4的二进制100，占4个bit，空位补0，因此存的是0100

01100010

00000011

00000100

这就是在vs编译器中，位段空间开辟的方式（当然，这个代码不能正确存储a和b的值，这里只是讲解空间如何开辟）

位段的跨平台问题

1.int位段被当成有符号数，还是无符号数是不确定的

2. 位段中最大位的数目不能确定
//32位机器最大是32，16位机器最大是16
struct a
{
    int a：40; //error
}；
3.位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义

4.当一个结构包含两个位段，第二个位段成员比较大，无法容纳第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的