C语言定义了如下基本数据类型:
short int long char float double.
在32位机上,上述数据类型大小分别为:
当我们定义如下UDT
typedef enum Color{
RED = 0x01,
BLUE,
GREEN,
YELLOW
}Color_Type;
typedef struct Car_Tag1{
bool m_hasSkylight;//1
Color_Type m_color;//4
bool m_isAutoShift;//1
double m_price;//8
unsigned char m_seatNum;//1
}Car_Type1;
(c标准并未定义bool。但stdbool.h中有bool宏定义)
如果按照各个元素字节大小直接相加,得到的结构体对象大小应为15字节。然而利用sizeof运算符得到的结果为32字节。
我们知道,当数据在内存的布局满足自然对齐的时候cpu对其的访问效率最高,自然对齐是指基本类型变量在内存中的起始地址可以被他们的大小整除,对于复合类型的对象,如果它的起始地址能够满足其中要求最高的数据成员的自然对齐要求,那么它也是自然对齐的。
所以编译器在编译时会对ADT成员进行对齐操作以提高效率,一般都会按照声明的先后顺序从低地址到高地址一次放置各成员,但为了满足对齐要求,各个成员之间可能会插入一定的填充字节。考虑到还可能会有结构体数组,也会在结构体对象的末尾插入填充字节。
Car_Type1类型的对象在内存的分布示意如下:
m_hasSkylight 1Bytes
填充 3Bytes
m_color 4Bytes
m_isAutoShift 1Bytes
填充 7Bytes
m_price 8Bytes
m_seatNum 1Bytes
填充 7Bytes
最后填充的字节是为了保证结构数组的连续性。
因此,对结构体的声明不同也会导致结构体对象在占用内存大小的不同,我们在声明结构体时应当将各成员按自然对齐字节大小降序排列,这样可以避免内存中出现大量的填充字节。
当我们将上述结构体声明调整为
typedef struct Car_Tag2{
double m_price;
Color_Type m_color;
bool m_hasSkylight;
bool m_isAutoShift;
unsigned char m_seatNum;
}Car_Type2;
时,内存映像布局如下
m_price 8Bytes
m_color 4Bytes
m_hasSkylight 1Bytes
m_isAutoShift 1Bytes
m_seatNum 1Bytes
填充1Bytes
由32字节降至16字节。此外,我们还可以将m_seatNum的类型由unsighed char 修改为unsighed short,并将其声明提前,充分利用内存空间的同时还可以避免数据上溢。