计算结构体大小是一个非常热门的考点:结构体内存对齐。
先来看下面这段代码:
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
struct S5
{
char c1;//对齐数为1
int arr[2];//对齐数为4
int i;//对齐数为4
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
printf("%d\n", sizeof(struct S3));
printf("%d\n", sizeof(struct S4));
printf("%d\n", sizeof(struct S5));
return 0;
}
为什么会出现这样的结果呢?结构体的大小到底该如何计算呢?
首先得掌握结构体的对齐规则:
1.第一个成员在与结构体变量偏移量为0的地址处。
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的偏移量地址处。
3.结构体的总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4.对于嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有对齐数中的最大对齐数(含嵌套结构体的对齐数)的整数倍。
5.当结构体中有数组成员的时候,判断数组成员的对齐数按数组成员的一个元素来判断。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值
VS中默认的值为8
Linux中默认的值为4
为什么存在内存对齐?
1.平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
假如说没有内存对齐,在S1中找 i,从开始位置先是找4个字节,其中三个字节是 i 的,然后再继续往下找4个字节,其中一个字节是 i 的,一共访问两次。如果内存对齐了,先找4个字节没有属于 i 的,继续找4个字节正好是 i ,一共访问了一次。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
让占用空间小的成员尽量集中在一起:
//例如
struct S1//12
{
char c1;
int i;
char c2;
};
struct S2//8
{
char c1;
char c2;
int i;
};
//S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
修改默认对齐数
使用#pragma这个预处理指令可以改变我们的默认对齐数。
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));//12
printf("%d\n", sizeof(struct S2));//6
return 0;
}
结论:结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。
百度笔试题:
写一个宏,计算结构体中某些变量相对于首地址的偏移,并给出说明。
考察:ofsetof宏的实现
//offsetof宏的实现
#include <stdio.h>
//把地址0看作一个结构体变量的首地址,此时每个成员的地址就是偏移量
#define OffSetOf(s, m) ((size_t)&(((s *)0)->m))//m的地址就是m和结构体首地址的偏移量(在0地址处只要不解引用取值就可以)
struct S
{
char ch1;//0
//1-3
int a;//4-7
char ch2;//8
//9-11
};
int main()
{
printf("%d\n", OffSetOf(struct S, ch1));
printf("%d\n", OffSetOf(struct S, a));
printf("%d\n", OffSetOf(struct S, ch2));
return 0;
}
当结构体变量已经定义了,有两种赋值方法:
//1.变量名.成员名 = 值;
//2.结构体变量指针->成员名 = 值;
注意:如果成员名是数组名的话,左边指的是数组首元素地址。
如果成员名是变量,左边指的是该变量,如果用于scanf中,要记得取地址,例如:
scanf("%d", &(s.age));