【C语言】自定义类型——计算结构体内存对齐

最新推荐文章于 2023-11-12 15:30:34 发布

s_persist

最新推荐文章于 2023-11-12 15:30:34 发布

阅读量531

点赞数 14

分类专栏： C语言复习总结文章标签： linux c语言

本文链接：https://blog.csdn.net/qq_52145272/article/details/120722037

版权

C语言复习总结专栏收录该内容

14 篇文章 2 订阅

订阅专栏

文章目录

前言
一、结构体
二、枚举
三、联合
总结

前言

一、结构体

结构体类型的声明

struct tag
{
	member-list;//成员列表
}variable-list;
//variable-list - 变量表，可直接在创建结构体的时候创建变量，也可不创建

//例如：
struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}；//分号不能丢

也可匿名

//匿名结构体类型
struct
{
	int a;
	char b;
	float c;
}x;
struct
{
	int a;
	char b;
	float c;
}a[20], *p;

虽然匿名且成员变量相同，但是两个结构体类型不相同。

p = &x;//错误

结构的自引用

结构体的自引用：在结构体定义的时候可以用结构体类型创建成员变量，用本身则称为结构体的自引用。
例如：

struct Node
{
	int data;
	struct Node next;
};
//但可行否？

如果可以，那sizeof(struct Node)是多少？
不断包含本身所以无法计算。
在这里插入图片描述
但可以包含本身类型的指针，因为指针大小固定大小（4/8）。

#include<stdio.h>
//正确定义
struct Node
{
	int data;
	struct Node* next;	
};
//正确定义别名
typedef struct Node
{
	int data;
	struct Node* next;
}Node;

int main()
{

	return 0;
}

结构体变量的定义和初始化

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

//初始化：定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu     //类型声明
{
	char name[15];//名字
	int age;    //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

*结构体内存对齐

现在引入一个新的问题，怎么计算结构体大小
先用sizeof()计算，看是否如你所想

#include<stdio.h>

struct st
{
	int data;
	char ch;	
};
int main()
{
	printf("%d\n", sizeof(struct st));
	return 0;
}

在这里插入图片描述
为什么不是4+1=5呢，这就要涉及到热点问题——结构体内存对齐

首先得掌握结构体的对齐规则：

第一个成员放在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS——默认的默认对齐数为8
Linux——没有默认对齐数
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

例如：

struct st1
{
	int data;//大小-4  vs-8 对齐数选较小的-4
	char ch; //对齐数 - 1
	int a;  //对齐数  - 4
};
//最大对齐数是4，所以所占内存大小必然是4的整数倍

struct st2
{
	int data;//大小-4  vs-8 对齐数选较小的-4
	char ch; //对齐数 - 1
	double a;  //对齐数  - 8
};
//最大对齐数是8，所以所占内存大小必然是8的整数倍

在这里插入图片描述
嵌套结构体也类似计算

如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

为什么存在内存对齐?
大部分的参考资料都是如是说的：

平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

设计结构体的时候，我们既要满足对齐，又要节省空间

让占用空间小的成员尽量集中在一起。

修改默认对齐数

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
	//原来就为8所以正常计算
	char c1;//对齐数- 1
	int i;//对齐数 - 4
	char c2;//对齐数 - 1
	//大小，4+4+4=12
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为8
struct S2
{
	//修改为1
	char c1;//对齐数- 1
	int i;//对齐数 - 1
	char c2;//对齐数 - 1
	//大小，1+4+1=6
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

在这里插入图片描述

结构体传参

struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}
int main()
{
	print1(s); //传结构体空间占用大
	print2(&s); //传地址空间占用小
	return 0;
}

结论
函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。
结构体传参的时候，要传结构体的地址。

结构体实现位段（位段的填充&可移植性）

什么是位段
位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 。
位段的成员名后边有一个冒号和一个数字。

位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

#include<stdio.h>
struct A
{
	int _a : 2;//2表示2bit(位)
	int _b : 5;//5位
	int _c : 10;//10位
	int _d : 30;//30位
};
//位段是按位存储，需要的总位数2+5+10+30=47  至少需要6个字节
//但此时位段又是以int类型4个字节开辟的，所以开辟两次8字节
int main()
{
	printf("%d\n", sizeof(struct A));
	return 0;
}

在这里插入图片描述

二、枚举

枚举类型的定义

枚举顾名思义就是一一列举。
把可能的取值一一列举。
比如我们现实生活中：

一周的星期一到星期日是有限的7天，可以一一列举。
性别有：男、女、保密，也可以一一列举。
月份有12个月，也可以一一列举
颜色也可以一一列举。

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};

enum Day就是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常
量。
这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值
例如：

enum Day//星期
{
	Mon=1,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};

那么Tues=2，依次往下递增

枚举的优点

我们可以使用 #define 定义常量，为什么非要使用枚举？枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

枚举的使用

enum Color//颜色
{
	RED=1,
	GREEN=2,
	BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 5; //错误，类型不同，且枚举变量一般不修改，易出错

三、联合

联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。
比如：

//联合类型的声明
union Un
{
	char c;
	int i;
};
//联合变量的定义
union Un un;
//计算联合变量的大小
printf("%d\n", sizeof(un));

联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。
在这里插入图片描述

联合体也可用于判断机器的大小端

#include<stdio.h>
union Un
{
	char c;
	int i;	
};


int check_sys()
{
	union Un un;
	un.i = 1;
	//低地址            高地址
	//小端存储 01 00 00 00
	//大端存储 00 00 00 01
	return un.c;//返回第一个字节的值
}
int main()
{
	printf("%d\n", check_sys());
	return 0;
}