【C语言】自定义类型——计算结构体内存对齐


前言


一、结构体

结构体类型的声明

struct tag
{
	member-list;//成员列表
}variable-list;
//variable-list - 变量表,可直接在创建结构体的时候创建变量,也可不创建

//例如:
struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}//分号不能丢

也可匿名

//匿名结构体类型
struct
{
	int a;
	char b;
	float c;
}x;
struct
{
	int a;
	char b;
	float c;
}a[20], *p;

虽然匿名且成员变量相同,但是两个结构体类型不相同。

p = &x;//错误

结构的自引用

结构体的自引用:在结构体定义的时候可以用结构体类型创建成员变量,用本身则称为结构体的自引用。
例如:

struct Node
{
	int data;
	struct Node next;
};
//但可行否?

如果可以,那sizeof(struct Node)是多少?
不断包含本身所以无法计算。
在这里插入图片描述
但可以包含本身类型的指针,因为指针大小固定大小(4/8)。

#include<stdio.h>
//正确定义
struct Node
{
	int data;
	struct Node* next;	
};
//正确定义别名
typedef struct Node
{
	int data;
	struct Node* next;
}Node;

int main()
{

	return 0;
}

结构体变量的定义和初始化

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu     //类型声明
{
	char name[15];//名字
	int age;    //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

*结构体内存对齐

现在引入一个新的问题,怎么计算结构体大小
先用sizeof()计算,看是否如你所想

#include<stdio.h>

struct st
{
	int data;
	char ch;	
};
int main()
{
	printf("%d\n", sizeof(struct st));
	return 0;
}

在这里插入图片描述
为什么不是4+1=5呢,这就要涉及到热点问题——结构体内存对齐

首先得掌握结构体的对齐规则:

  1. 第一个成员放在与结构体变量偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
    VS——默认的默认对齐数为8
    Linux——没有默认对齐数
  3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

例如:

struct st1
{
	int data;//大小-4  vs-8 对齐数选较小的-4
	char ch; //对齐数 - 1
	int a;  //对齐数  - 4
};
//最大对齐数是4,所以所占内存大小必然是4的整数倍

struct st2
{
	int data;//大小-4  vs-8 对齐数选较小的-4
	char ch; //对齐数 - 1
	double a;  //对齐数  - 8
};
//最大对齐数是8,所以所占内存大小必然是8的整数倍

在这里插入图片描述
嵌套结构体也类似计算

  1. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

为什么存在内存对齐?
大部分的参考资料都是如是说的:

  1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总体来说:

结构体的内存对齐是拿空间来换取时间的做法。

设计结构体的时候,我们既要满足对齐,又要节省空间

  • 让占用空间小的成员尽量集中在一起。

修改默认对齐数

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
	//原来就为8所以正常计算
	char c1;//对齐数- 1
	int i;//对齐数 - 4
	char c2;//对齐数 - 1
	//大小,4+4+4=12
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为8
struct S2
{
	//修改为1
	char c1;//对齐数- 1
	int i;//对齐数 - 1
	char c2;//对齐数 - 1
	//大小,1+4+1=6
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

在这里插入图片描述

结构体传参

struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}
int main()
{
	print1(s); //传结构体空间占用大
	print2(&s); //传地址空间占用小
	return 0;
}

结论
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结构体传参的时候,要传结构体的地址。

结构体实现位段(位段的填充&可移植性)

什么是位段
位段的声明和结构是类似的,有两个不同:

  1. 位段的成员必须是 int、unsigned int 或signed int 。
  2. 位段的成员名后边有一个冒号和一个数字。

位段的内存分配

  1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
#include<stdio.h>
struct A
{
	int _a : 2;//2表示2bit(位)
	int _b : 5;//5位
	int _c : 10;//10位
	int _d : 30;//30位
};
//位段是按位存储,需要的总位数2+5+10+30=47  至少需要6个字节
//但此时位段又是以int类型4个字节开辟的,所以开辟两次8字节
int main()
{
	printf("%d\n", sizeof(struct A));
	return 0;
}

在这里插入图片描述

二、枚举

枚举类型的定义

枚举顾名思义就是一一列举。
把可能的取值一一列举。
比如我们现实生活中:

一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举
颜色也可以一一列举。

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};

enum Day就是枚举类型。 {}中的内容是枚举类型的可能取值,也叫枚举常
量 。
这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值
例如:

enum Day//星期
{
	Mon=1,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};

那么Tues=2,依次往下递增

枚举的优点

我们可以使用 #define 定义常量,为什么非要使用枚举? 枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 防止了命名污染(封装)
  4. 便于调试
  5. 使用方便,一次可以定义多个常量

枚举的使用

enum Color//颜色
{
	RED=1,
	GREEN=2,
	BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5; //错误,类型不同,且枚举变量一般不修改,易出错

三、联合

联合类型的定义

联合也是一种特殊的自定义类型 这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
比如:

//联合类型的声明
union Un
{
	char c;
	int i;
};
//联合变量的定义
union Un un;
//计算联合变量的大小
printf("%d\n", sizeof(un));

联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
在这里插入图片描述
在这里插入图片描述

联合体也可用于判断机器的大小端

#include<stdio.h>
union Un
{
	char c;
	int i;	
};


int check_sys()
{
	union Un un;
	un.i = 1;
	//低地址            高地址
	//小端存储 01 00 00 00
	//大端存储 00 00 00 01
	return un.c;//返回第一个字节的值
}
int main()
{
	printf("%d\n", check_sys());
	return 0;
}

联合大小的计算

  • 联合的大小至少是最大成员的大小。
  • 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍

总结

结构体内存对齐是C语言的一大难点,也非常重要。本人水平有限,如有错误欢迎指正。

  • 14
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

s_persist

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值