结构体
结构体的声明与定义
结构是一些值得集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量
声明1
struct Student
{
char name[30];
int age;
}s1,s2;
这里只是对结构体Student进行了声明,并没有开辟空间来存放它。代码中的s1,s2是 struct Student类型的全局变量,可以在main函数中直接调用。
定义1
struct Student s;
这是对结构体Student的定义,表明已经给它实际分配了内存的空间
声明2
typedef struct Teacher
{
char name[30];
int age;
}T;
这里的T是 typedef(重定义) 出来的,相当于将 struct Teacher 重定义为 typedef struct Teacher T。在定义结构体时可直接使用它。
定义2
T s = { "English" , 18 };
直接用T即可定义该结构体,结构体的初始化是使用一对花括号({ })进行的。
结构体定义的是变量的集合,严格来说是定义出这些变量的类型
结构体内存对齐(重点)
结构体内存对齐的规则
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的最小值。
VS中默认的值为8- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
内存对齐的练习
练习1
struct S1
{
char c1;
int i;
char c2;
};
根据规则进行分析:
- 首先c1的处于结构体地址为0的地方,占1个Byte(规则1)
- 接下来的 i 应该在地址为4的地方,并且在c1 和 i 之间补3Byte(规则2)
- c2紧挨着 i (地址为8)的地方,占1个Byte
- 整体的大小,由于前面只占了9个Byte,不满足规则3,因此需要再补3个Byte,变为12Byte,即可满足规则3
- 结构体s1的大小为12Byte
过程如图所示:
练习2
struct S1
{
char c1;
char c2;
int i;
};
分析:
- c1处于地址为0的地方,占1个Byte
- c2紧挨着c1,占1个Byte
- i 的对齐数为4,因此需要加2个Byte到地址为4的地方,i 占4个Byte
- 总计8Byte,满足规则3,因此结构体s1的大小为8Byte
练习3
struct S2
{
double d;
char c;
int i;
};
分析:
- d处于地址为0的地方,占8个Byte
- c的对齐数为1,因此c紧挨着d,占1个Byte
- i 的对齐数为4,因此需要在原有的字节(9Byte),再加上3个Byte,达到12Byte,再存放 i ,i占4个Byte
- 总计16Byte,并且满足规则3,因此结构体s2的大小为16Byte
如图所示:
练习4
struct S3
{
char c1;
struct S2 s2;//结构体嵌套
double d;
};
分析:
- c1处于地址为0的地方,占1个Byte
- 由练习3可知,结构体s2的最大对齐数为8,因此需要补上7个Byte,在地址为8的地方,存放s2,占16个Byte(规则4)
- 前面总计占用24Byte,满足规则2,因此d紧挨着放置即可,占8个Byte
4.该结构体的最大对齐数为8,总共有32Byte,满足规则3,因此结构体s3的大小为32Byte
如图所示:
从练习中,我们可以清晰的发现内存对齐的问题是:浪费了空间,它的本质是以空间来换取时间的做法
内存对齐存在的原因
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
举个例子:
假设在32位的系统下,计算机有32根数据线,一次向内存可以读4Byte,那么每次读内存的时候都是从4Byte的整数倍开始读的。
假设现在该系统要读一个结构体s的内存,s的声明如下:struct s
{
char c;
int i;
};当内存对齐时读 i ,如图:
当内存不对齐时读 i ,如图:
因此,要对结构体的内存进行对齐,虽说浪费了空间,但是提高了系统的效率。
那么在设计结构体的时候,我们既要满足对齐,又要节省空间,可以让占用空间小的成员尽量集中在一起,如练习1和练习2一样,练习1的大小为12Byte,练习2的大小为8Byte,同样的成员变量,不同的排序会造成不同的大小。
修改默认对齐数
#pragma pack(2) //将默认的对齐数设置为2
#pragma pack()//取消设置的的默认对齐数,并还原为默认的
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。
位段
位段的声明和结构体是类似的,但有两点不同:
- 位段的成员必须是 int、unsigned int 或signed int 。
- 位段的成员名后边有一个冒号和一个数字。
举个例子:
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
冒号后的数字代表着该变量只占多少位(bit)。如a就只占3bit;并且位段的成员只能是整型。
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
位段S的大小计算:(1Byte = 8bit)
- 如果按结构体来计算,那么它的大小应该为4Byte,但是对于位段来说就不是这样了。
- 首先a占了3bit,b占了4bit,那么a和b就可以放在1个Byte中
- c占了5bit,d占了4bit,他们不能组合在一起,因此,他们放在两个不同的Byte中
- 因此,位段S的大小为3Byte。
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
求abcd在内存中是如何分配的。
如图所示:
跟结构体相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
枚举
枚举就是枚举常量的列举类型,简单来说就是把可能的取值一一列举出来
举个例子:
enum Day
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
其中,Day就是一个枚举类型。Day中的内容就是它的可能取值,也叫枚举常量。并且它是默认从0开始递增的。
联合
联合也是一种特殊的自定义类型 这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体),联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
举个例子:
union A
{
int i;
char ch;
};
union A aa;
aa.i = 0x11223344;
aa.ch = 0x00
在运行之后,ch的地址是0x00332211(小端机),这就体现了内存的共用,为 i 赋值后,对ch的修改就是在 i 的地址上修改。
练习
设计一个函数,判断当前计算机的大小端存储,大端返回1,小端返回0,用联合体的特性来表示。
分析:
利用联合体共用内存的性质,对第一个变量进行赋值,然后判断第二个变量的大小,根据大小来分辨大小端机。
代码如下:
union Data
{
int i;
char ch;
};
int isBigSystem() {
union Data d;
d.i = 1;//0x00000001 //自己规定的左高右低
if (d.ch == 1) { // 01 00 00 00 小端机 vs中规定左低右高
return 0;
}
else
{ // 00 00 00 01 大端机
return 1;
}
}
联合体大小的计算
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。