C语言中的结构体2——结构体尺寸

本文介绍了CPU字长如何影响处理器的数据处理能力,以及地址对齐的概念,强调了对齐在内存存取效率中的重要性。同时,探讨了变量的m值和结构体的M值计算,以及如何通过attribute机制手动调整变量对齐。最后,讨论了数据可移植性和零长数组在结构体中的应用,特别是在动态内存分配和可变长度数据处理中的作用。
摘要由CSDN通过智能技术生成

1、CPU字长

        字长的概念指的是处理器在一条指令中的数据处理能力,当然这个能力还需要搭配操作系统的设定,比如常见的32位系统、64位系统,指的是在此系统环境下,处理器一次存储处理的数据可以达32位或64位。

CPU字长的含义

 

2、地址对齐

        CPU字长确定之后,相当于明确了系统每次存取内存数据时的边界,以32位系统为例,32位意味着CPU每次存取都以4字节为边界,因此每4字节可以认为是CPU存取内存数据的一个单元

        如果存取的数据刚好落在所需单元数之内,那么我们就说这个数据的地址是对齐的,如果存取的数据跨越了边界,使用了超过所需单元的字节,那么我们就说这个数据的地址是未对齐的。

 地址已对齐的情形

 

        从图中可以明显看出,数据本身占据了8个字节,在地址未对齐的情况下,CPU需要分3次才能完整地存取完这个数据,但是在地址对齐的情况下,CPU可以分2次就能完整地存取这个数据

        总结:如果一个数据满足以最小单元数存放在内存中,则称它地址是对齐的,否则是未对齐的。地址对齐的含义用大白话说就是1个单元能塞得下的就不用2个;2个单元能塞得下的就不用3个。如果发生数据地址未对齐的情况,有些系统会直接罢工,有些系统则降低性能。

3、普通变量的m值

        以32位系统为例,由于CPU存取数据总是以4字节为单元,因此对于一个尺寸固定的数据而言,当它的地址满足某个数的整数倍时,就可以保证地址对齐。这个数就被称为变量的m值。

根据具体系统的字长,和数据本身的尺寸,m值是可以很简单计算出来的。

  • 举例:
char   c; // 由于c占1个字节,因此c不管放哪里地址都是对齐的,因此m=1
short  s; // 由于s占2个字节,因此s地址只要是偶数就是对齐的,因此m=2
int    i; // 由于i占4个字节,因此只要i地址满足4的倍数就是对齐的,因此m=4
double f; // 由于f占8个字节,因此只要f地址满足4(32)|8(64)的倍数就是对齐的,因此m=4、8

printf("%p\n", &c); // &c = 1*N,即:c的地址一定满足1的整数倍
printf("%p\n", &s); // &s = 2*N,即:s的地址一定满足2的整数倍
printf("%p\n", &i); // &i = 4*N,即:i的地址一定满足4的整数倍
printf("%p\n", &f); // &f = 4*N,即:f的地址一定满足4的整数倍

注意,变量的m值跟变量本身的尺寸有关,但它们是两个不同的概念。

  • 手工干预变量的m值:
char c __attribute__((aligned(32))); // 将变量 c 的m值设置为32
  • 语法:
    • attribute 机制是GNU特定语法,属于C语言标准语法的扩展。
    • attribute 前后都是双下划线,aligned两边是双圆括号
    • attribute 语句,出现在变量定义语句中的分号前面,变量标识符后面
    • attribute 机制支持多种属性设置,其中 aligned 用来设置变量的 m 值属性
    • 一个变量的 m 值只能提升,不能降低,且只能为正的2的n次幂。

4、结构体的M值

  • 概念:
    • 结构体的M值,取决于其成员的m值的最大值。即:M = max{m1, m2, m3, …};
    • 结构体的地址和尺寸,都必须等于M值的整数倍
  • 示例:
struct node
{
    short  a; // 尺寸=1,m值=2
    double b; // 尺寸=8,m值=4、8
    char   c; // 尺寸=1,m值=1
};

struct node n; // M值 = max{2, 4, 1} = 4;
  • 以上结构体成员存储分析:
  1. 结构体的M值等于4、8,这意味数结构体的地址、尺寸都必须满足4、8的倍。
  2. 成员a的m值等于2,但a作为结构体的首元素,必须满足M值约束,即a的地址必须是4、8的倍数
  3. 成员b的m值等于4、8,因此在a和b之间,需要填充2、6个字节的无效数据(一般填充0)
  4. 成员c的m值等于1,因此c紧挨在b的后面,占一个字节即可。
  5. 结构体的M值为4、8,因此成员c后面还需填充3、7个无效数据,才能将结构体尺寸凑足4、8的倍数。

 

5、可移植性

        可移植指的是相同的一段数据或者代码,在不同的平台中都可以成功运行

  • 对于数据来说,有两方面可能会导致不可移植:
    • 数据尺寸发生变化
    • 数据位置发生变化

        第一个问题,起因是基本的数据类型在不同的系统所占据的字节数不同造成的,解决办法是使用可移植性数据类型即可。

考虑结构体:

struct node
{
    int8_t  a;
    int32_t b;
    int16_t c;
};

        以上结构体,在不同的的平台中,成员的尺寸是固定不变的,但由于不同平台下各个成员的m值可能会发生改变,因此成员之间的相对位置可能是飘忽不定的,这对数据的可移植性提出了挑战。

解决的办法有两种:

  • 第一,固定每一个成员的m值,也就是每个成员之间的塞入固定大小的填充物固定位置:
struct node
{
    int8_t  a __attribute__((aligned(1))); // 将 m 值固定为1
    int64_t b __attribute__((aligned(8))); // 将 m 值固定为8
    int16_t c __attribute__((aligned(2))); // 将 m 值固定为2
};
  • 第二,将结构体压实,也就是每个成员之间不留任何空隙
struct node
{
    int8_t  a;
    int64_t b;
    int16_t c;
} __attribute__((packed));

压实后的实例:

typedef struct Node
{
    char c ; // 2
    short s ; // 2
    char c2 ; // 4
    int i; // 4
    char c3; // 4
    long k ; // 8 
}__attribute__((packed)) Node1 ,*P_Node1 ;

6、零长数组:

  • 概念:长度为0的数组,比如 int data[0];
  • 用途:放在结构体的末尾,作为可变长度数据的入口
#include <stdio.h>
#include <stdlib.h>
#include <string.h>


typedef struct Node
{
    char Name[32];
    int Num ;

    int Size; // 用于记录结构体后有多少字节是合法内存
    char Msg[0];
}Node , *P_Node ;



int main(int argc, char const *argv[])
{
    
    Node Data ;

    printf("%ld\n" , sizeof(Data));

    P_Node ptr = calloc( 1, sizeof(Data)+16 );
    ptr->Size = 16 ;

    strncpy(ptr->Name , "Even" , 32);
    ptr->Num = 123 ;
    // ptr->Msg = 
    strncpy(ptr->Msg , "他是一个非常优秀的老师。。" , 16);

    printf("Name:%s Num:%d Msg:%s\n" , 
        ptr->Name , ptr->Num , ptr->Msg );


    return 0;
}

未完待续


有疑问的小伙伴可以留言一起交流讨论!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值