自定义类型：结构体(续)

最新推荐文章于 2024-09-14 22:25:23 发布

OKkankan

最新推荐文章于 2024-09-14 22:25:23 发布

阅读量1.1k

点赞数 127

文章标签：算法 c++ c语言 c# 开发语言

本文链接：https://blog.csdn.net/OKkankan/article/details/141976721

版权

一. 结构体的内存对齐

在前面的文章里我们已经讲过一部分的内存对齐的知识，并举出了两个例子，我们再举出两个例子继续说明：

struct S3
{
	double a;
	int b;
	char c;
};
int mian()
{
    printf("%zd\n",sizeof(struct S3);
    return 0;
}

有了之前的知识，我们可以大胆计算一下这次的结果是多少，double占8个字节，所以int可以紧接着double后面进行排序，所以一共应该是8+4+1=13，又因为我们对齐规则的第三条：结构体的总大小为最大对齐数的整数倍，所以最终结果应该是16，让我们来验证一下：结果是正确的，我们再来举另一个例子：

struct S3
{
	double d;
	char c;
	int i;
};
struct S4
{
	char c1;
	struct S3 s3;
	double d;
};
int main()
{
	printf("%d\n", sizeof(struct S4));
	return 0;
}

大家可以发现的是这个例子不同之处是结构体中嵌套了另一个结构体，这个应该怎么计算?我们来回顾一下对齐规则的第四条：如果结构体中嵌套了另一个结构体，那么嵌套的结构体应该对齐到其成员的最大对齐数的整数倍处，结构体整体的大小应该是所有对齐数的整数倍(包含嵌套结构体成员)，所以我们这个的最终结果就是32。

1.1 为什么存在内存对齐？

平台原因：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数，那么就可以用一个内存操作来读或者写值了。否则，我们可能需要执行两次内存访问，因为对象可能被分放在两个8字节内存块中。

总体来说：内存对齐是拿空间换取时间的做法。 那在设计结构体的时候，我们既要满⾜对⻬，⼜要节省空间，如何做到：让占用空间小的成员尽量集中在一起。

比如：

struct s1
{
	char a;
	int b;
	char c;
};
struct s2
{
	char a;
	char b;
	int c;
};

虽然s1和s2的成员是一样的，但是排放的位置不一样，空间占用的内存却是不一样的，所以我们尽可能的让占用空间小的成员尽量集中在一起。

1.2 修改默认对齐数

#pragma 这个预处理指令，可以改变编译器的默认对齐数。

#include <stdio.h>
#pragma pack(1)//设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的对齐数，还原为默认
int main()
{
	//输出的结果是什么？
	printf("%zd\n", sizeof(struct S));
	return 0;
}

原本结构体的大小应该是12，但是我们将默认对齐数改变之后结果就变成6，所以当默认对齐的方式不一样的时候，我们可以自己更改默认对齐数。

二. 结构体传参

对于结构体传参，要怎样做呢？

struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}
int main()
{
	print1(s); //传结构体
	print2(&s); //传地址
	return 0;
}

上面的 print1 和 print2 函数哪个好些？答案是：首选print2函数。也就是首选结构体地址传参的方法，原因：1. 函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。2. 如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

结论： 结构体传参的时候，要传结构体的地址 。

三. 结构体实现位段

3.1 什么是位段？

位段的声明和结构是类似的，有两个不同：

1. 位段的成员必须是 int、unsigned int 或signed int ，在C99中位段成员的类型也可以

选择其他类型。 2. 位段的成员名后边有一个冒号和一个数字。

struct A
{
	int a : 2;
    int b : 3;
    int c : 4;

};

上面的A就是一个段位类型，那么A占的内存是多少呢？位段的位其实就是二进制的位，也就是说它的单位是bit位，意思就是a占2个bit位，b占3个bit位，其实这样就是更好的省下空间，比如我们在某些需求上没有要求很大的空间，一些小的空间就可以满足，我们就没有必要去给整整四个字节也就是32个bit位这么多。而且我们还要注意的是，比如上面的int a，int类型是占4个字节，也就是32个bit位，所以最多a：后面最大只能是32，这个也是需要注意的一点。

3.2 位段的内存分配

在我们简单了解了位段是是什么之后？我们就来了解一下位段是如何分配内存的？为了方便演示，我们拿char类型的来说明：

struct A
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct A s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	printf("%zd\n", sizeof(struct A));
}

跟据上图我们来做一个详细解释：首先我们先开放一个字节8个bit位，但是给定了空间后，在空间内部是从右向左使用，还是从左向右使用，这个不确定。另外就是当剩下的空间不足以存放下一个成员的时候，空间是浪费还是使用，不确定。在上面我们只是假设从右向左，浪费。

运行之后是3个字节，所以跟我们的验证是一样的，但是在不同的编译器上可能会出现不同的结果。

在我们将数字转换成二进制之后放入对应的内存空间中的时候，对于像a这样的，二进制是1010，但是内存空间只有3个bit位的话，我们就放从右向左的三位（这个也是按照编译器来的），然后实际存放的数值就按4个bit位来算。这就是我们位段的一些简单介绍。

3.3 位段的一些跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会

出问题。）

3. 位段中的成员在内存中从左向右分配，还是从右向左分配，标准尚未定义。

4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃

剩余的位还是利用，这是不确定的。

总结：跟结构体相比，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台的问题存在。

位段的用处还是有很多的：在网络协议中，IP数据报的格式，我们可以看到其中很多的属性只需要几个bit位就能描述，这里使用位段，能够实现想要的效果，也节省了空间，这样网络传输的数据报大小也会较小一些，对网络的畅通是有帮助的。

3.4位段使用的注意事项

位段的几个成员共有同一个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位置处是没有地址的。内存中每个字节分配一个地址，一个字节内部的bit位是没有地址的。

所以不能对位段的成员使用&操作符，这样就不能使用scanf直接给位段的成员输入值，只能是先输入放在⼀个变量中，然后赋值给位段的成员。

struct A
{
	
	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};
int main()
{
	struct A sa = { 0 };
	scanf("%d", &sa._b);//这是错误的

	//正确的⽰范
	int b = 0;
	scanf("%d", &b);
	sa._b = b;
	return 0;
}

大家可以自己去尝试一下这段代码。