10. sizeof()函数的使用

    sizeof关键字以字节形式给出了一个变量或者是一种类型(包括集合类型)存储的字节数。sizeof关键字返回一个size_t类型的值。当应用于结构类型或变量时,sizeof返回实际大小,这可能包含填充空间的字节。当应用于静态维度的数组时,sizeof返回整个数组的大小。sizeof操作符不能返回动态创建数组的大小或外部数组的大小。

    请分析下面代码的输出:

    #include <stdio.h>

    int main()

    {

        char *p;

        char *q[20];

        char *m[20][20];

        int (*n)[10]; // 表示一个指向10个整数元素数组的指针

 

        typedef struct

        {

            char dda;

            double dda1;

            int type;

        }MyStruct;

 

        MyStruct k;

 

        printf("%d %d %d %d %d ", sizeof(p), sizeof(q), sizeof(m), sizeof(n), sizeof(k));

    }

    对程序中的变量进行分析可知:

    (1)指针变量的sizeof()

    指针记录了一个对象的地址,既然是来存放地址的,那么它当然等于计算机内部地址总线的宽度。所以在32位计算机中,一个指针变量的返回值必定为4(结果是以字节为单位)。可以预计,在将来的64位系统中指针变量的sizeof值为8.

    指针变量的sizeof值与指针所指的对象没有任何关系,正是由于所有的指针变量所占内存大小相等,所以MFC消息处理函数使用两个参数WPARAM、LPARAM就能传递各种复杂的消息结构(使用指向结构体的指针)。因此,对于指针p,不论它的类型是char,int,float,double,sizeof(p)的值为4.

    (2)数组的sizeof()

    i. 数组的sizeof值等于数组所占用的内存字节数。例如:

       char a1[] = "abc";

 

      int a2[3];

      sizeof(a1); // 结果为4,字符的末尾还存在一个NULL终止符

      sizeof(a2); // 结果为3*4=12(依赖于int)

    ii. sizeof不是求数组元素的个数,求数组中元素的个数可用如下的表达式:

        int c1 = sizeof(a1) / sizeof(char); // 总长度/单个元素的长度

      int c2 = sizeof(a1) / sizeof(a1[0]); // 总长度/第一个元素的长度

    iii. 对于函数参数的sizeof

        void foo1(char a3[3])

      {

          int c3 = sizeof(a3); // c3 ==  4

      }

      void foo2(char a4[])

      {

         int c4 = sizeof(a4); // c4 ==  4

      }

      c3!=3,这里函数参数a3已不再是数组类型,而是变成指针,相当于char *a3,数组是“传址”的,调用者只需将实参的地址传递过去,所以a3自然为指针类型(char*),c3的值也就为4。

    iv. 在本程序中     

        char *q[20];

        char *m[20][20];

        求sizeof(q)相当于求20个指针变量的数组所占的字节数,而sizeof(m)相当于求400个指针变量的数组所占的字节数,其结果分别为80和1600.

    (3)结构体的sizeof()

    When applied to a structure type or variable, sizeof returns the actual size, which may include padding bytes inserted for alignment.

    字节对齐有助于加快计算机的取数速度,否则就得多花指令周期。为此,编译器默认会对结构体进行处理(实际上其它地方的数据变量也是如此),让宽度为2的基本数据类型(short等)都位于能被2整除的地址上,让宽度为4的基本数据类型(int等)都位于能被4整除的地址上,依次类推。这样,两个数中间就可能需要加入填充字节,所以整个结构体的sizeof值就增加了。

 

 

    字节对齐的细节和编译器实现相关,但一般而言,满足三个准则:

    ①.结构体变量的首地址能够被其最宽基本类型成员的大小所整除;

 

    ②.结构体每个成员相对于结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要编译器会在成员之间加上填充字节(internal padding);

 

    ③.结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节(trainling padding)。

 

    对上面的三个准则,说明如下:

    ①.结构体某个成员相对于结构体首地址的偏移量可以通过宏offsetof()获得,这个宏在stddef.h中定义,如下:

    #define offsetof(s,m) (size_t)&(((s *)0)->m)

    例如,想得到k中dda1的偏移量,方法为

    size_t pos = offsetof(k, dda1);

    ②.基本类型是指像char、int、float、double这样的内置数据类型,数据宽度是指其sizeof的大小。由于结构体的成员可以是复合类型,比如另外一个结构体,所以在寻找最宽基本类型成员时,应当包括复合类型成员的子成员,而不是把复合成员看成一个整体。但在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。

    struct S1

    {

       char c;

       int i;

    };

    struct S3

    {

     char c1;

     S1 s;

  char c2;

 };

    S1的最宽简单成员的类型为int, S3在考虑最宽简单类型成员时是将S1“打散”看的,所以S3的最宽简单类型为int,这样,通过S3定义的变量,其存储空间首地址需要被4整除,整个sizeof(S3)的值也应该被4整除。

    c1的偏移量为0,s是一个整体,它作为结构体变量也满足前面三个准则,所以其大小为8,偏移量为4,c1与 s之间便需要3个填充字节,c2与s之间不需要填充字节,所以c2的偏移量为12,由于c2的大小为13,13是不能被4整除的,这样末尾还得补上3个填充字节。最后得到sizeof(S3)的值为16.

    通过上述过程,可以得到一个公式:

    结构体的大小等于最后一个成员的偏移量加上其大小再加上末尾的填充字节数据,即

    sizeof(struct) = offsetof(last item) + sizeof(last item) + sizeof(trailing padding)

 

    有一个影响sizeof的重要参量为编译器的pack指令。它是用来调整结构体对齐方式的,不同编译器名称和用法略有不同,VC6中通过#pragma pack实现,也可以直接修改/Zp编译开关。

    #pragma pack的基本用法为:#pragam pack(n),n为字节对齐数,其取值为1、2、4、8、16,默认是8,如果这个值比结构体成员的sizeof值小,那么该成员的偏移量应该以此值为准,即是说,结构体成员变量的偏移量应该取二者的最小值。

    公式如下:

    offsetof(item) = min(n, sizeof(item))

    再看示例:

    #pragma pack(push) // 将当前pack设置压栈保存

    #pragma pack(2) // 必须在结构体定义之前使用

    struct S1

    {

        char c;

        int i;

    };

    struct S3

    {

        char c1;

        S1 s;

        char c2;

    };

    #pragma pack(pop) // 恢复先前的pack设置

    计算sizeof(S1)时,min(2,sizeof(i))的值为2,所以i的偏移量为2,加上sizeof(i)等于6,能够被2整除,所以整个S1的大小为6.

    同样,对于sizeof(S3),s的偏移量为2,c2的偏移量为8,加上sizeof(c2)等于9,不能被2整除,添加一个填充字节,所以sizeof(S3)等于10.

    空结构体(不含数据成员)的大小不为0,而是1。编译器为其分配一个字节的空间用于占位。如下:

    struct S4 {};

    sizeof(S4); // 结果为1

 

    因此,对于本文开始时程序中的结构体k,dda所占字节为1,dda1所占字节为8,因此在dda和dda1之间需要填充7个字节,在int后需要填充4个字节,故sizeof(k) = 24。

    (4)union的sizeof

    struct在内存组织上是顺序式的,union则是重叠式,各成员共享一段内存,所以整个union的sizeof也就是每个成员sizeof的最大值。结构体的成员可以是复合类型,复合类型成员被作为整体考虑。

    如下:

    union U

    {

        int i;

        char c;

        S1 s;

    };

    sizeof(U) = sizeof(s);

 

    程序的执行结果如下:

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值