为什么结构的sizeof不等于每个成员的sizeof之和？

最新推荐文章于 2021-05-17 15:49:15 发布

p15097962069

最新推荐文章于 2021-05-17 15:49:15 发布

阅读量418

点赞数

文章标签： c++ c struct sizeof c++-faq

原文链接：https://vi.sofbug.com/question/UzL

版权

为什么sizeof运算符返回的结构大小大于结构成员的总大小？

#1楼

这是因为添加了填充以满足对齐约束。数据结构对齐会影响程序的性能和正确性：

对齐错误的访问可能是一个硬错误（通常是SIGBUS ）。
对齐错误的访问可能是一个软错误。
- 要么在硬件中进行了校正，以适度降低性能。
- 或通过软件仿真进行纠正，以免导致性能严重下降。
- 此外，原子性和其他并发保证可能会被破坏，从而导致细微的错误。

这是一个使用x86处理器的典型设置的示例（所有使用的32位和64位模式）：

struct X
{
    short s; /* 2 bytes */
             /* 2 padding bytes */
    int   i; /* 4 bytes */
    char  c; /* 1 byte */
             /* 3 padding bytes */
};

struct Y
{
    int   i; /* 4 bytes */
    char  c; /* 1 byte */
             /* 1 padding byte */
    short s; /* 2 bytes */
};

struct Z
{
    int   i; /* 4 bytes */
    short s; /* 2 bytes */
    char  c; /* 1 byte */
             /* 1 padding byte */
};

const int sizeX = sizeof(struct X); /* = 12 */
const int sizeY = sizeof(struct Y); /* = 8 */
const int sizeZ = sizeof(struct Z); /* = 8 */

通过按对齐方式对成员进行排序（按基本类型中的大小进行排序即可），可以使结构的大小最小化（类似于上面示例中的结构Z ）。

重要说明：C和C ++标准均声明结构对齐方式是实现定义的。因此，每个编译器可能选择不同地对齐数据，从而导致不同且不兼容的数据布局。因此，在处理将由不同编译器使用的库时，重要的是要了解编译器如何对齐数据。一些编译器具有命令行设置和/或特殊的#pragma语句以更改结构对齐设置。

#2楼

如果您隐式或显式设置了结构的对齐方式，则可以这样做。对齐4的结构将始终是4个字节的倍数，即使其成员的大小不是4个字节的倍数也是如此。

另外，库可能会在x86下使用32位int进行编译，并且您可能在64位进程中比较其组件，如果您手动执行此操作，则会得到不同的结果。

#3楼

包装和字节对齐，如在C FAQ描述在这里：

这是为了对齐。如果很多处理器挤满了单向，那么它们将无法访问2字节和4字节的数量（例如，整数和长整数）。

假设您具有以下结构：
 struct { char a[3]; short int b; long int c; char d[3]; }; 
现在，您可能认为应该可以像下面这样将这种结构打包到内存中：
 +-------+-------+-------+-------+ | a | b | +-------+-------+-------+-------+ | b | c | +-------+-------+-------+-------+ | c | d | +-------+-------+-------+-------+ 
但是，如果编译器这样安排，则在处理器上要容易得多：
 +-------+-------+-------+ | a | +-------+-------+-------+ | b | +-------+-------+-------+-------+ | c | +-------+-------+-------+-------+ | d | +-------+-------+-------+ 
在压缩版中，请注意，您和我至少很难看到b和c字段如何环绕？简而言之，处理器也很难。因此，大多数编译器将像这样填充结构（好像带有额外的不可见字段）：
 +-------+-------+-------+-------+ | a | pad1 | +-------+-------+-------+-------+ | b | pad2 | +-------+-------+-------+-------+ | c | +-------+-------+-------+-------+ | d | pad3 | +-------+-------+-------+-------+ 

#4楼

这可能是由于字节对齐和填充所致，因此该结构在您的平台上显示为偶数个字节（或字）。例如，在Linux上的C中，以下3种结构：

#include "stdio.h"


struct oneInt {
  int x;
};

struct twoInts {
  int x;
  int y;
};

struct someBits {
  int x:2;
  int y:6;
};


int main (int argc, char** argv) {
  printf("oneInt=%zu\n",sizeof(struct oneInt));
  printf("twoInts=%zu\n",sizeof(struct twoInts));
  printf("someBits=%zu\n",sizeof(struct someBits));
  return 0;
}

成员的大小（以字节为单位）分别为4字节（32位），8字节（2x 32位）和1字节（2 + 6位）。上面的程序（在使用gcc的Linux上）将大小打印为4、8和4-填充最后一个结构，以便它是一个单词（在我的32位平台上为4 x 8位字节）。

oneInt=4
twoInts=8
someBits=4

#5楼

例如，如果您希望结构在GCC中具有特定大小，请使用__attribute__((packed)) 。

在Windows上，将cl.exe编译器与/ Zp选项一起使用时，可以将对齐方式设置为一个字节。

通常，CPU会更轻松地访问4（或8）的倍数的数据，具体取决于平台和编译器。

因此，这基本上是对齐的问题。

您需要有充分的理由进行更改。

#6楼

除了其他答案外，结构可以（但通常没有）具有虚函数，在这种情况下，结构的大小还将包括用于vtbl的空间。

#7楼

由于所谓的堆积，结构的尺寸大于其各个部分的总和。特定处理器具有可以使用的首选数据大小。如果32位（4字节），大多数现代处理器的首选大小。当数据位于这种边界上时，访问内存比跨越该大小边界的访问效率更高。

例如。考虑简单的结构：

struct myStruct
{
   int a;
   char b;
   int c;
} data;

如果机器是32位机器，并且数据在32位边界上对齐，则我们会看到一个紧迫的问题（假设没有结构对齐）。在此示例中，让我们假设结构数据从地址1024开始（0x400-请注意，最低的2位为零，因此数据与32位边界对齐）。对data.a的访问将正常进行，因为它始于边界-0x400。对data.b的访问也可以正常工作，因为它位于地址0x404（另一个32位边界）上。但是，未对齐的结构会将data.c放在地址0x405。 data.c的4个字节位于0x405、0x406、0x407、0x408。在32位计算机上，系统将在一个内存周期内读取data.c，但只会获取4个字节中的3个（第4个字节位于下一个边界）。因此，系统将必须进行第二次内存访问才能获得第4个字节，

现在，如果编译器不是将data.c放在地址0x405上，而是将结构填充3个字节并将data.c放在地址0x408上，那么系统将只需要1个周期来读取数据，从而减少了对该数据元素的访问时间减少了50％填充将内存效率交换为处理效率。鉴于计算机可以拥有大量的内存（许多GB），因此编译器认为交换（速度超过大小）是一个合理的选择。

不幸的是，当您尝试通过网络发送结构甚至将二进制数据写入二进制文件时，此问题将成为致命的杀手。在结构或类的元素之间插入的填充可能会破坏发送到文件或网络的数据。为了编写可移植的代码（一个将用于多个不同的编译器的代码），您可能必须分别访问结构的每个元素以确保正确的“打包”。

另一方面，不同的编译器具有管理数据结构打包的不同能力。例如，在Visual C / C ++中，编译器支持#pragma pack命令。这将允许您调整数据打包和对齐。

例如：

#pragma pack 1
struct MyStruct
{
    int a;
    char b;
    int c;
    short d;
} myData;

I = sizeof(myData);

我现在的长度应该为11。如果没有编译指示，则我可以是11到14之间的任何值（对于某些系统，它最多可以是32个），具体取决于编译器的默认打包方式。

#8楼

C语言为编译器提供了一些有关内存中结构元素位置的自由度：

内存孔可能出现在任何两个组件之间以及最后一个组件之后。这是由于以下事实：目标计算机上的某些类型的对象可能受寻址边界的限制
sizeof运算符的结果中包括“内存孔”的大小。 sizeof仅不包括灵活数组的大小，在C / C ++中可用
该语言的某些实现使您可以通过编译指示和编译器选项来控制结构的内存布局

C语言为程序员提供了结构中元素布局的一些保证：

编译器需要分配一系列组件以增加内存地址
第一个组件的地址与结构的起始地址一致
未命名的位字段可以包含在结构中，以与相邻元素所需的地址对齐一致

与元素对齐有关的问题：

不同的计算机以不同的方式排列对象的边缘
位域宽度的不同限制
计算机在字节中存储字节的方式有所不同（Intel 80x86和Motorola 68000）

对齐方式如何工作：

结构占用的体积计算为此类结构阵列中对齐的单个元素的大小。该结构应结束，以使下一个结构的第一个元素不违反对齐要求

ps此处有更多详细信息：“ Samuel P.Harbison，Guy L.Steele CA参考，（5.6.2-5.6.7）”

#9楼

这个想法是出于速度和缓存方面的考虑，应该从与它们的自然大小对齐的地址中读取操作数。为了做到这一点，编译器填充了结构成员，以便对齐后面的成员或后面的结构。

struct pixel {
    unsigned char red;   // 0
    unsigned char green; // 1
    unsigned int alpha;  // 4 (gotta skip to an aligned offset)
    unsigned char blue;  // 8 (then skip 9 10 11)
};

// next offset: 12

x86体系结构始终能够获取未对齐的地址。但是，它速度较慢，并且当未对齐重叠两条不同的缓存行时，如果对齐的访问仅逐出一条，则它会逐出两条缓存行。

实际上，某些架构必须捕获未对齐的读写，以及ARM架构的早期版本（已演化为当今所有移动CPU的一种）……好吧，实际上它们只是为这些架构返回了错误的数据。（他们忽略了低阶位。）

最后，请注意，高速缓存行可以任意大，并且编译器不会尝试猜测高速缓存行或在空间与速度之间进行权衡。相反，对齐决策是ABI的一部分，代表最终将均匀填充缓存行的最小对齐。

TL; DR：对齐很重要。