结构体的sizeof

最新推荐文章于 2022-03-14 09:39:05 发布

aufeju

最新推荐文章于 2022-03-14 09:39:05 发布

阅读量950

点赞数

分类专栏： c++ 文章标签： C++ sizeof 结构体

c++ 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

#include <stdio.h>

struct{
       long a;
       char b;
       short c;
       char d;
}y;

struct{
       long a;
       short b;
       char d;
       int c;
}yy;

struct{
       long a;
       short b;
       int c;
       char d;
}yyy;

struct{
       char a;
       short b;
       long c;
       char d;
       char e;
}yyyy;

struct{
       long a;
       short b;
       long c;
       char d;
       char e;
}yyyyy;

main()
{
printf("y=%d\n",sizeof(y));
printf("yy=%d\n",sizeof(yy));
printf("yyy=%d\n",sizeof(yyy));
printf("yyyy=%d\n",sizeof(yyyy));
printf("yyyyy=%d\n",sizeof(yyyyy));

return 0;
}
被sizeof(struct)弄晕了大半天，上面的sizeof(结构体)后的字节大小，怪异得很，比如yy与yyy结构体，只是把int c位置移动一下，得出来的结果却不同了。当然其他几个也是晕乎乎的，主要可能没弄懂其中本质的东西。
目前运行结果为：
y=12
yy=12
yyy=16
yyyy=12
yyyyy=16

最佳答案：

struct{
       long a;
       char b;
       short c;
       char d;
}y;

在y里面：
我写了这么一个代码：
struct y temp;

printf("%d\n%d\n%d\n%d\n",&temp.a,&temp.b,&temp.c,&temp.d);
结果是：
1245044
1245048
1245050
1245052
这个上面的是地址，是y里面的a,b ,c ，d的里面的地址，我想你用的是VC，那么它是按照四个字节来对齐的，a占四个地址，b占一个，c两个，d一个，struct{
       long a;//1245044
       char b;//1245048
       short c;//1245050
       char d;//1245052
}y;
考虑到字节对齐的情况，有看我上面给你的答案，就很容易理解了
a有四个，b占一个，但是c是从1245050开始的，也就是说空了以个地址为：1245049这里是补在b后面的，不足的就用0来补了，bc两个在一起占了四个字节，那么前面的abc加起来就是8个了，那么d是一个字节，应为是四个字节对齐，不足要补齐四个字节，那么d占了四个字节
所以一共才是 12个字节

struct{
       long a;//4
       short b;//2
       char d;//1
       int c;//4
}yy;
考虑到对齐的情况：
4+4+4=12   b占了两个，d占了一个，但是不足的应该补齐，所以bd一共占了四个

struct{
       long a;
       short b;
       int c;
       char d;
}yyy;
a=4;b=2;c =4 d = 1
这里注意了，a 占四个，b占两个，四个字节对齐要补两个，c占四个，d占一个，那么不足要补齐三个所以是：
4+4+4+4=16

struct{
       char a;
       short b;
       long c;
       char d;
       char e;
}yyyy;
a后面补了一个，和b一共占有4个，c四个，de一共占了四个
4+4+4=12

struct{
       long a;
       short b;
       long c;
       char d;
       char e;
}yyyyy;
a=4 b占了两个，那么要补两个，c占了四个，de占了四个
4+4+4+4=16

你要看它后面的那个和前面的那个的和是不是大于4的，所以为什么要补齐，你看看我下面给你的资料，除了struct,还有union的

建议：如果你在开始的是这么定义一下：
#pragma pack(push)
#pragma pack(1)//注意这里括号里是1

struct{
       long a;
       char b;
       short c;
       char d;
}y;

#pragma pack(pop)
那么现在大小是什么呢？答案是：4+1+2+1=8它是按一个字节对齐的。
为什么？你看下面的资料吧

以下是资料：
typedef union //定义共用体
{
long i; //long 四个字节
int k[5]; //int 四个字节 4*5 = 20
char c; //char 一个字节：
}DATE;
上面的结构体是联合：联合的结构体取中间最大的就可以了，因为他们是公用的，所以找到最大的空间，那么小的也能装在大的里面，如果你取小的，那么大的就不能装在小的里面了；
分析一下：上面最大的是：20
struct date //定义结构体
{
int cat; //int 四个字节
DATE cow; //DATE 一个联合体：20个字节
double dog; //double 8个字节
}too;
//上面的结构体不是联合的，所以：就应该是4+20+8 = 32

因此答案就是：20+32 =52（这结论有点乱，哪来的20+32呀？smx）

我个人觉得如果你要对结构体了解的话，这个事远远不够的
比如说：
struct date //定义结构体
{
int cat; //int 四个字节
DATE cow; //DATE 一个联合体：20个字节
double dog; //double 8个字节

char a;
}too;
如果考虑对齐的话：
我在上面的结构体里加了一个char a，那么现在结构体多大呢你说是53，54，56，这样其实都是对的?为什么呢？
因为这个要取决于你的机器是按什么对齐的。
看下面的一段代码：

#pragma pack(push)
#pragma pack(n)
struct date //定义结构体
{
int cat; //int 四个字节
DATE cow; //DATE 一个联合体：20个字节
double dog; //double 8个字节
char a;
}too;
#pragma pack(pop)
对于这个结构体：对齐方式就取决于#pragma pack(n)中n的取值了，如果n=4,那么上面的结构体就是：56，如果n = 1,那么就是53，n=2那么就是54，切忌这里的N只能为：1，2 ， 4， 8
不过现在的计算机的内存都很大了，不需要节省内存，一般都是四个字节对齐的。默认的是四个字节，但是在嵌入式领域里，一般都是按一个字节对齐的。

下面为了加深你的了解：给你点资料。呵呵

DATE maxx;
#pragma pack(pop)

int main()
{
printf("%d",sizeof(struct date)+sizeof(maxx)); /*相当于struct date这个结构体所占空间大小加上DATE max这个结构体所占空间的大小。*/
return 0;
}

这是初学者问得最多的一个问题，所以这里有必要多费点笔墨。让我们先看一个*
结构*体：

struct S1
{
char c;
int i;
};
问*sizeof*(s1)*等*于多少？聪明的你开始思考了，char占1个字节，int占4个字节，那么加起来就应该是5。是这样吗？你在你机器上试过了吗？也许你是对的，但很可能你是错的！V

C6中按默认设置得到的结果为8。
Why？为什么受伤的总是我？
请*不*要沮丧，我们来好好琢磨一下*sizeof*的定义——*sizeof*的结果*等*于对象或者类型所占的内存字节数，好吧，那就让我们来看看S1的内存分配情况：
S1 s1 = { a , 0xFFFFFFFF };
定义上面的变量后，加上断点，运行程序，观察s1所在的内存，你发现了什么？
以我的VC6.0为例，s1的地址为0x0012FF78，其数据内容如下：
0012FF78: 61 CC CC CC FF FF FF FF
发现了什么？怎么中间夹杂了3个字节的CC？看看MSDN上的说明：
When applied to a structure type or variable, *sizeof* returns the actual size,which may include padding bytes inserted for alignment.
原来如此，这就是传说中的字节对齐啊！一个重要的话题出现了。
为什么需要字节对齐？计算机组成原理教导我们这样有助于加快计算机的取数速度，否则就得多花指令周期了。为此，编译器默认会对*结构*体进行处理（*实际*上其它地方的数据变量也是如此），让宽度为2的基本数据类型（short*等*）都位于能被2整除的地址上，让宽度为4的基本数据类型（int*等*）都位于能被4整除的地址上，以此类推。这样，两个数中间就可能需要加入填充字节，所以整个*结构*体的*sizeof*值就增长了。
让我们交换一下S1中char与int的位置：
struct S2
{
int i;
char c;
};
看看*sizeof*(S2)的结果为多少，怎么还是8？再看看内存，原来成员c后面仍然有
3个填充字

节，这又是为什么啊？别着急，下面总结规律。

字节对齐的细节*和*编译器实现相关，但一般而言，满足三个准则：
1) *结构*体变量的首地址能够被其最宽基本类型成员的大小所整除；
2) *结构*体每个成员相对于*结构*体首地址的偏移量（offset）都是成员大小的整数倍，如有需要编译器会在成员之间加上填充字节（internal adding）；
3) *结构*体的总大小为*结构*体最宽基本类型成员大小的整数倍，如有需要编译器会在最末一个成员之后加上填充字节（trailing padding）。

对于上面的准则，有几点需要说明：
1) 前面*不*是说*结构*体成员的地址是其大小的整数倍，怎么又说到偏移量了呢？因为有了第1点存在，所以我们就可以只考虑成员的偏移量，这样思考起来简单。想想为什么。
*结构*体某个成员相对于*结构*体首地址的偏移量可以通过宏offsetof()来获得，这个宏也在stddef.h中定义，如下：
#define offsetof(s,m) (size_t)&(((s *)0)->m)
例如，想要获得S2中c的偏移量，方法为
size_t pos = offsetof(S2, c);// pos*等*于4
2) 基本类型是指前面提到的像char、short、int、float、double这样的内置数据类型，这里所说的“数据宽度”就是指其*sizeof*的大小。由于*结构*体的成员可以是复合类型，比如另外一个*结构*体，所以在寻找最宽基本类型成员时，应当包括复合类型成员的子成员，而*不*是把复合成员看成是一个整体。但在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。
这里叙述起来有点拗口，思考起来也有点挠头，还是让我们看看例子吧（具体数值仍以VC6为例，以后*不*再说明）：
struct S3
{
char c1;
S1 s;
char c2
};
S1的最宽简单成员的类型为int，S3在考虑最宽简单类型成员时是将S1“打散”看的，所以S3的最宽简单类型为int，这样，通过S3定义的变量，其存储空间首地址需要被4整除，整个*sizeof*(S3)的值也应该被4整除。
c1的偏移量为0，s的偏移量呢？这时s是一个整体，它作为*结构*体变量也满足前面三个准则，所以其大小为8，偏移量为4，c1与s之间便需要3个填充字节，而c2与s之间就*不*需要了，

所以c2的偏移量为12，算上c2的大小为13，13是*不*能被4整除的，这样末尾还得补上3个填充字节。最后得到*sizeof*(S3)的值为16。
通过上面的叙述，我们可以得到一个公式：
*结构*体的大小*等*于最后一个成员的偏移量加上其大小再加上末尾的填充字节数目，即：

*sizeof*( struct ) = offsetof( last item ) + *sizeof*( last item ) +*sizeof*( trailing padding )

到这里，朋友们应该对*结构*体的*sizeof*有了一个全新的认识，但*不*要高兴得太早，有一个影响*sizeof*的重要参量还未被提及，那便是编译器的pack指令。它是用来调整*结构*体对齐方式的，*不*同编译器名称*和*用法略有*不*同，VC6中通过#pragma pack实现，也可以直接修改/Zp编译开关。
#pragma pack的基本用法为：#pragma pack( n )，n为字节对齐数，其取值为1、2、4、8、16，默认是8，如果这个值比*结构*体成员的*sizeof*值小，那么该成员的偏移量应该以此值为准，即是说，*结构*体成员的偏移量应该取二者的最小值，公式如下：
offsetof( item ) = min( n, *sizeof*( item ) )
再看示例：
#pragma pack(push) // 将当前pack设置压栈保存
#pragma pack(2)// 必须在*结构*体定义之前使用
struct S1
{
char c;
int i;
};
struct S3
{
char c1;
S1 s;
char c2
};
#pragma pack(pop) // 恢复先前的pack设置
计算*sizeof*(S1)时，min(2, *sizeof*(i))的值为2，所以i的偏移量为2，加上*sizeof*(i)*等*于6，能够被2整除，所以整个S1的大小为6。
同样，对于*sizeof*(S3)，s的偏移量为2，c2的偏移量为8，加上*sizeof*(c2)*等*于9，*不*能被2整除，添加一个填充字节，所以*sizeof*(S3)*等*于10。
现在，朋友们可以轻松的出一口气了，

还有一点要注意，“空*结构*体”（*不*含数据成员）的大小*不*为0，而是1。试想一个“*不*占空间”的变量如何被取地址、两个*不*同的“空*结构*体”变量又如何得以区分呢？
于是，“空*结构*体”变量也得被存储，这样编译器也就只能为其分配一个字节的空间用于占位了。

如下：
struct S5 { };
*sizeof*( S5 ); // 结果为1

8. 含位域*结构*体的*sizeof*
前面已经说过，位域成员*不*能单独被取*sizeof*值，我们这里要讨论的是含有位域的*结构*体的*sizeof*，只是考虑到其特殊性而将其专门列了出来。
C99规定int、unsigned int*和*bool可以作为位域类型，但编译器几乎都对此作了扩展，允许其它类型类型的存在。
使用位域的主要目的是压缩存储，其大致规则为：
1) 如果相邻位域字段的类型相同，且其位宽之*和*小于类型的*sizeof*大小，则后面的字段将紧邻前一个字段存储，直到*不*能容纳为止；
2) 如果相邻位域字段的类型相同，但其位宽之*和*大于类型的*sizeof*大小，则后面的字段将从新的存储单元开始，其偏移量为其类型大小的整数倍；
3) 如果相邻的位域字段的类型*不*同，则各编译器的具体实现有差异，VC6采取*不*压缩方式，Dev-C++采取压缩方式；
4) 如果位域字段之间穿插着非位域字段，则*不*进行压缩；
5) 整个*结构*体的总大小为最宽基本类型成员大小的整数倍。

还是让我们来看看例子。
示例1：
struct BF1
{
char f1 : 3;
char f2 : 4;
char f3 : 5;
};
其内存布局为：
|_f1__|__f2__|_|____f3___|____|
|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|
0 3 7 8 1316
位域类型为char，第1个字节仅能容纳下f1*和*f2，所以f2被压缩到第1个字节中，
而f3只能

从下一个字节开始。因此*sizeof*(BF1)的结果为2。
示例2：
struct BF2
{
char f1 : 3;
short f2 : 4;
char f3 : 5;
};
由于相邻位域类型*不*同，在VC6中其*sizeof*为6，在Dev-C++中为2。
示例3：
struct BF3
{
char f1 : 3;
char f2;
char f3 : 5;
};
非位域字段穿插在其中，*不*会产生压缩，在VC6*和*Dev-C++中得到的大小均为3。

9. 联合体的*sizeof*
*结构*体在内存组织上是顺序式的，联合体则是重叠式，各成员共享一段内存，所以整个联合体的*sizeof*也就是每个成员*sizeof*的最大值。*结构*体的成员也可以是复合类型，这里，复合类型成员是被作为整体考虑的。
所以，下面例子中，U的*sizeof*值*等*于*sizeof*(s)。
union U
{
int i;
char c;
S1 s;
};

1）提高存取效率
一般处理器是32位的，一次可以从内存中读取32位数据，一般分配给变量地址是4的倍数，如果你定义的结构成员横跨了32位边界，CPU要读取2次。这里就是浪费了时间。

2）为了在不同处理器下兼容。
早期MIPS处理器只能读取4字节对齐的后的结构，非4倍数地址访问，会造成死机问题。

3）VC一般默认8字节对齐是为了配合64位处理器，8也是4的倍数，因此也适合32位处理器。但就是浪费内存。

4）内存紧张的嵌入式环境，常会需要1字节对齐。。