结构体内存对齐

最新推荐文章于 2024-03-08 19:02:35 发布

叫嚣的泡芙

最新推荐文章于 2024-03-08 19:02:35 发布

阅读量94

点赞数 1

分类专栏： C语言文章标签： c语言

本文链接：https://blog.csdn.net/cyrilcloud/article/details/117446012

版权

C语言专栏收录该内容

12 篇文章 0 订阅

订阅专栏

结构体的声明

结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

结构的声明

struct tag
{
     member-list;
}variable-list;

例如描述一个学生：

struct Stu
{
   char name[20];//名字
   int age;//年龄
   char sex[5];//性别
   char id[20];//学号
};//分号不能丢

特殊的声明

在声明结构的时候，可以不完全的声明

比如：

//匿名结构体类型
struct
{
    int a;
    char b;
    float c;
}x;
struct
{
    int a;
    char b;
    float c; 
}a[20],*p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。

那么问题来了？

//上面代码的基础上，下面的代码合法吗？
p = &x;

警告：编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。

结构体的自引用

先解释一下什么是结构体的自引用。

在数据结构中的链表的概念，链表中的结点既要能够存放数据又能找到下一个结点。

如果这样定义结点

struct Node
{
   int data;//4bit
   struct Node n;//不知道该给分配多大的内存
}

但是不能这样写，因为结构体类型不能包含自己。

正确的做法是一个结点里可以包括下一个结点的地址。

struct Node
{
   int data;//4bit
   struct Node* next;//4bit
};

关于结构体typedef

不能像下面这样写

typedef struct
{
    int data;
    Node* next;
}Node;

不能在没有定义Node这个类型名就使用，下面的是正确的。

typedef struct Node
{
    int data;
    struct Node* next;
}Node;

结构体变量的定义和初始化

有了结构体类型，那如何定义变量，其实很简单。

struct Point
{
    int x;
    int y;
}p1;                      //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

//初始化：定义变量的同时赋初值
struct Point p3 = {x, y}

struct Stu       //类型声明
{
   char name[15];//名字
   int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化

struct Node
{
   int data;
   struct Point p;
   struct Node* next;
}n1 = {10, {4,5}, NULL};            //结构体嵌套初始化

struct Node n2 = {20, {5,6}, NULL};//结构体嵌套初始化

结构体内存对齐

struct S1
{
    char c1;
    int a;
    char c2;
};

struct S2
{
    char c1;
    char c2;
    int a;
};

int main()
{
    struct S1 s1 = {0};
    printf("%d\n", sizeof(s1));
    struct S2 s2 = {0};
    printf("%d\n", sizeof(s2));

    return 0;
}

运行结果
在这里插入图片描述
如何计算？首先得掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

对齐数=编译器默认的一个对齐数与该成员大小的较小值。

VS中默认的值为8
struct S1的存储图示

struct S1的存储样式图

假设从橙色箭头开始存放，第一个成员在与结构体变量偏移量为0的地址处，我们把c1存放在偏移量0的位置。

第二个成员要对齐在对齐数的整数倍的地址处。int型是4个字节，编译器默认对齐数是8，较小值是4，4的整数倍的地址处是4，所以a要存储在偏移量4的位置。

第三个成员也要对齐在对齐数的整数倍的地址处。char型是1个字节，编译器默认对齐数是8，较小值是1，1的整数倍的地址处是8，所以c2要存储在偏移量8的位置。

结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。最大对齐数是4，所以最合适的三倍，也就是12字节。

S2以此类推
在这里插入图片描述

struct S2的存储样式图

假设从橙色箭头开始存放，第一个成员在与结构体变量偏移量为0的地址处，我们把c1存放在偏移量0的位置。

第二个成员要对齐在对齐数的整数倍的地址处。char型是1个字节，编译器默认对齐数是8，较小值是1，所以a要存储在偏移量2的位置。

第三个成员也要对齐在对齐数的整数倍的地址处。int型是4个字节，编译器默认对齐数是8，较小值是4，所以c2要存储在偏移量4的位置。

结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。最大对齐数是4，所以最合适的两倍，也就是8字节。

struct S3
{
   double d;
   char c;
   int i;
};

struct S4
{
    char c1;
    struct s3 s3;
    double d;
};

int main()
{
    struct S3 s3 = {0};
    printf("%d\n", sizeof(s3));
    struct S4 s4 = {0};
    printf("%d\n", sizeof(s4));

    return 0;
}

运行结果
在这里插入图片描述
这里说一下 s4的计算过程

第一个成员在与结构体变量偏移量为0的地址处，我们把c1存放在偏移量0的位置。

第二个元素是个结构体，嵌套的结构体对齐到自己的最大对齐数的整数倍处，S3最大对齐数是8，所以对齐到8。s3大小是16。

第三个成员也要对齐在对齐数的整数倍的地址处。double型是8个字节，编译器默认对齐数是8，较小值是8，所以c2要存储在偏移量24的位置。

结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。最大对齐数是8，所以最合适的两倍，也就是32字节。

为什么要存在内存对齐

大部分的参考资料都是如是说的

平台原因（移植原因）：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则拋出硬件异常。
性能原因：数据结构（尤其是栈）应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

比如说32位机器上有32根数据线，也就是一次读取数据32bit，换算出来是4个字节。

如果我们想读取结构体中的int a，不内存对齐的从c开始读取要读取两次，然后把a前后拼起来，但使用内存对齐，可以直接从a开头读，只需要读一次。

所以这是一种空间换时间的方法。
在这里插入图片描述
那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到；

让占用空间小的成员尽量集中在一起。

struct S1
{
    char c1;
    int a;
    char c2;
};

struct S2
{
    char c1;
    char c2;
    int a;
};

S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。

修改默认对齐数

#pragma这个预处理指令，可以改变我们的默认对齐数

//设置默认对齐数位1
#pragma pack(1)
struct S
{
	char c1;  //1
	double d;//8
};
#pragma pack()
//取消设置的默认对齐数

int main()
{
    struct S s;
    printf("%d\n", sizeof(s));
    return 0;
}