C语言结构体深度剖析

目录

前言:

什么是结构体

结构体变量

结构的声明:

匿名类结构体类型

结构体自引用

结构体变量的定义和初始化

结构体传参

1.传值

2.传址

结构体内存对齐

对齐规则

修改默认对齐数

offsetof宏

内存对齐的意义

位段

什么是位段

位段的内存分配

位段的跨平台问题



📌————本章重点————📌

🔗 结构体内存对齐

🔗位段的内存分配


 ✨————————————✨

前言:

什么是结构体:

        结构体是由一批数据组合而成的结构型数据。组成结构型数据的每个数据称为结构型数据的“成员”。

结构体变量:

        结构体是C语言中一种重要的数据类型,该数据类型由一组称为成员(或称为域,或称为元素)的不同数据组成,其中每个成员可以具有不同的类型。

        结构体类型不是由系统定义好的,而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。

        关键字struct和结构体名组合成一种类型标识符,其地位如同通常的int、char等类型标识符,其用途就像 int 类型标识符标识一样可以用来定义结构体变量。

        定义变量以后,该变量就可以像定义的其他变量一样使用了;成员又称为成员变量,它是结构体所包含的若干个基本的结构类型,必须用“{}”括起来,并且要以分号结束,每个成员应表明具体的数据类型。


结构的声明:

这里先练习一个最简单且直观的声明写法:

struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};

匿名类结构体类型

  • 在声明结构的时候,可以不声明标签,这样的写法叫做匿名类型;
  • 匿名结构体类型只能使用一次;
  • 如果声明多个匿名类型,即使它们的成员变量都相同,编译器也会将它们视为不同类型;
struct {
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};


结构体自引用

  • 在一个结构体内部包含类型为该结构体本身的成员,叫做自引用;
  • 结构体不能包含同类型的结构体,只能包含同类型的结构体指针;

1.未重命名的:

2.重命名的:


结构体变量的定义和初始化

1.全局定义和初始化:p1,p2,p3都作为全局变量.

struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
}p1,p2,p3;
struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
}p1={"zhangsan", 12, '男'};

2.局部变量的定义和初始化:在主函数内部产生.

struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};
int main()
{
	struct Peo p2  ={"zhansan", 12, '男'};//在主函数内部定义一个p2变量

	return 0;
}


结构体传参

  • 结构体传参时可以传值可以传址;
  • 首选传址:因为函数传参时是需要压栈的,只要压栈就会导致系统在时间和空间上的开销,倘若传的是结构体对象,而且过大时,更会导致效率大打折扣;

1.传值

解引用使用点号(.):

struct stu
{
	int arr[5];
	char ch;
};
void Print(struct stu s)
{
	for (int i = 0; i < 5; i++)
	{
		printf("%d ", s.arr[i]);
	}
	printf("%c\n", s.ch);
}
int main()
{
	struct stu s1 = { { 1,2,3,4,5 },'a' };

	Print(s1);

	return 0;
}

2.传址

解引用使用指向符(->):

struct stu
{
	int arr[5];
	char ch;
};
void Print(struct stu* s)
{
	for (int i = 0; i < 5; i++)
	{
		printf("%d ", s->arr[i]);
	}
	printf("%c\n", s->ch);
}
int main()
{
	struct stu s1 = { { 1,2,3,4,5 },'a' };

	Print(&s1);

	return 0;
}


结构体内存对齐

思考:当我们计算某个结构体的大小时,难道也是直接根据对应成员的数据类型大小求和吗?

  • 其实结构体的大小不能直接根据成员大小来计算,而是与每个成员的定义顺序有关;

 我们先来看这个在面这个例子:三个结构体的成员只是顺序不同,就导致大小有所差异。

究其原因是因为结构体在存储时存在内存对齐。

接下来就手把手带你计算结构体大小,不想会都难,学会了将一劳永逸。

对齐规则:

  • 第一个成员在偏移量为0的地址处;
  • 后面的成员变量,从上一个成员的结束位置开始向后找,找到某个数(对齐数的整数倍位置);
  • 对齐数 = 编译器默认对齐数 与 该成员类型的较小值;(vs默认是8)
  • 最终结构体的总大小:是最大对齐数(每个成员的对齐数)的整数倍;
  • 如果结构体嵌套:嵌套的结构体先根据上述方法对齐到正确的位置,最终结构体的大小是所有对齐数的整数倍(包括被嵌套的结构体的对齐数);

 上述代码图解:

修改默认对齐数:

有时候结构对齐数不合适,我们可以使用#pragam预处理命令,可以修改默认对齐数;

像下面这样,默认对齐数改为了1该结构体大小就变为14:

#pragma pack(1)
struct Peo
{
	char name[5];
	int age;
	char sex[5];
};
#pragma pack()
int main()
{
	printf("%zd\n", sizeof(struct Peo));

	return 0;
}

若将默认对齐数改为7,会出现这样的警告:

offsetof宏

这里介绍一个宏:可以计算结构体成员在内存中的偏移量

size_t offsetof( structName, memberName );

内存对齐的意义:

通过上述演示我们发现,既然内存对齐存在浪费空间的情况,那为什么要注意做呢?

实质上:内存对齐是拿空间换去时间的做法;

  • 性能方面:

        首先我们要搞清楚一点:在cpu看来,内存并不是简单的以一个字节去划分的,而是以块为单位,一个块可能是2,4,8,16个字节,因此将结构体内存对齐,可以避免处理器进行二次访问内存,节省时间成本;

  • 移植性原因:

        并不是所有的硬件平台都能访问任意地址处的数据;

结论:我们在设计结构体成员时,要尽可能安排合适的顺序,考虑到内存对齐,防止过多的空间被浪费。


位段

什么是位段

        位段这一概念是结构体中必须提到的知识点,C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为“位段”或称“卫浴”( bit field) 。利用位段能够用较少的位数存储数据。

        比如我只需要一个表示0或1的数,那么就只需要给它分配1个bit位即可,如果只需要一个表示0~3的数,那么只需要给它分配2个bit位即可。

要求:

  • 位段的成员必须是int、unsigned int、signed int(或者char);
  • 位段的我成员名之后有一个冒号和数字;
  • 冒号后面的大小不能超过前面类型的所属bit位大小;

比如:下面这样一个结构体大小只占4个字节:

因此,结构体在内存对齐时会浪费空间,那么利用位段可以节省空间

struct stu
{
	int a : 1;
	int b : 2;
	int c : 3;
	int d : 4;
};
int main()
{
	printf("%zd\n", sizeof(struct stu));

	return 0;
}

 既然如此,那位段的内存又是如何分配的呢?

位段的内存分配

下面这个例子输出为:3 0 3 12 13;

struct stu
{
	char a : 1;
	char b : 3;
	char c : 5;
	char d : 6;
};
int main()
{
	printf("%zd\n", sizeof(struct stu));

	struct stu s1 = { 0 };

	s1.a = 10;
	s1.b = 11;
	s1.c = 12;
	s1.d = 13;

	printf("%d\n", s1.a);
	printf("%d\n", s1.b);
	printf("%d\n", s1.c);
	printf("%d\n", s1.d);

	return 0;
}

过程:

  1. a只有分配了1个bit位,而10的二进制有效位占了4个bit位,10被截断为0,先开辟一个字节(假设8个bit位)空间,放a,这个字节剩余7个bit位;
  2. b同样得到3个bit位,11被截断为三位变成3,这三位在刚才剩余的7位中能放下,则紧跟着放入b;
  3. c同样的到5个bit位,12被截断为5位,可以完整表示12,但由于刚才已经使用了(1+3=)4个bit位,剩余4位不够放c的值,那么再开辟一个字节空间,依次类推,最终为该结构开辟了3个字节空间。

图解:

位段的跨平台问题:

虽说使用位段可以很好的节省空间,但是它也存在缺陷,那就是跨平台问题:

  • int 位段被当成有符号数还是无符号数是不确定的;
  • 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题);
  • 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义;
  • 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的;


  • 13
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 15
    评论
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@糊糊涂涂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值