面试C技术的人在基础笔试时总会被问的问题是变量空间的问题
尤其是一些混合结构的类型空间
本次就对其中具有代表性的结构体类型进行说明,便于给长记性
测试环境: gcc 4.8.1 Ubuntu 13.04 32-bit
就从以下的实例开始说起:
struct Pad1{
char a;
};
struct Pad2{
int b;
};
struct Pad3{
char a;
int b:2;
double c;
};
struct Pad4{
char a;
double c;
int b:2;
};
以上定义了4个结构类型,采用基本的数据类型定义(复杂类型在这个基础上可以扩展)
提出问题:
1、以上结构体的大小在32位系统和64位系统的结果是否一致?
2、大小端存储类型是否有对以上结果是否有影响?
3、结构体内变量顺序是否对结构体空间大小有影响?有无最小化规律可循?
4、指针变量类型对结构体有什么影响?
分析问题:
根据实践,以上结构体的空间大小(单位:byte)结果为:
sizeof Pad1 is: 1
sizeof Pad2 is: 4
sizeof Pad3 is: 12
sizeof Pad4 is: 16
根据以上内容,看到这样的结果最令人奇怪的是两个方面:
A、Pad3与Pad4变量内容相同(顺序差异),然而结果却不同
B、定义int b:2 的目的是什么,如果仅定义 int 会有什么不同
咱们先来说B,定义之所以定义限定位数的整型变量,是因为如果不这样写,两个sizeof的结果相同!
这就引出了A,当结构体中的变量内容相同,仅顺序不同会有什么什么影响
回答这个问题需要了解一个前提:内存存储都是整数对齐的,即按照字节或者字对齐
因此大多数编译器为了迎合这个对齐的功能,在进行编译时会将变量进行对齐处理
在32bit系统中,按照4个字节进行对齐,因此当出现混合类型的变量时
sizeof的结果不是简单的累加,而要考虑对齐的扩展,可以确定的是不比理论值小。
至于大了多少,要看那些变量类型涉及到对齐,以Pad3和Pad4为例
理论上都是 total = a:1 + b:2 + c:8 = 11
Pad3中a和b连续,加起来不足4个字节,因此为了对齐将两者共分配4个字节,
最终结果为啥是12(4+8)就不难理解了;
同理,Pad4中因为a与c是连续的,两者加起来是9 不足4的倍数,补足后是12
加上最后的b(2)是14,再补得16。
解决问题:
通过以上分析,回答提出的几个问题:
1、32位与64位的差别:就是对齐字节数不同,32位是4个字节,64位是8个字节
所以两者结果有是否会有不同,答案可以自己实践一下。
2、大小端类型(不明白这个名词的可以搜索一下)对这个所占空间结果没有影响
但对联合体中变量的赋值会有影响,所以这里特别指出。
3、变量顺序是否有影响已经在示例中说明了,肯定的说是有的
但是正如例子中说的之所以有的时候没有影响,那只是因为前后结合后造成的补齐结果相同而已
例如: 1+ 4 + 8 结合顺序为 5 --》 8 + 8 = 16 ,如果是 1 + 8 + 4 结合顺序为 9 --》 12 + 4 = 16
虽然都是16 ,但本质是有差别的。
要使空间最小化,一个常用的参考就是哈夫曼原则,即从小到大进行排序定义变量。
4、指针类型变量记住一个原则:大小永远是4个字节(64位是8个字节)