自定义类型——结构体,枚举,联合

结构体

  聚合数据类型(aggregate data type)能够同时存储超过一个的单独数据。C提供了两种类型的聚合数据类型,数组和结构。数组是相同类型的元素的集合,它的每个元素是通过下标引用或指针间接访问来选择的。而结构是通过名字访问的。
  结构也是一些值的集合,这些值称为它的成员,但结构的各个成员可能具有不同的类型,并且结构也并不是它自身成员的数组。和数组名不同,当一个结构变量在表达式中使用时,它并不被替换成一个指针。

1.结构声明

struct tag
{
    member-list;
}variable-list;

如:

struct S
{
    int a;
    char b;
    float c;
}x;

当然在声明结构的时候可以不完全声明。如:

struct 
{
    int a;
    char b;
    float c;
}x;
//这个声明创建了一个名叫x的变量,它包含三个成员:一个整数、一个字符、一个浮点数
struct 
{
    int a;
    char b;
    float c;
}y[20],*z;
//这个声明创建了y和z。y是一个数组,它包含了20个结构。z是一个指针,它指向这个类型的结构。

  这两个声明被编译器当作两种截然不同的类型,即使它们的成员列表完全相同。因此,变量y和z的类型不同,所以z = &x ;是非法的。

2.结构成员

  结构体成员可以是标量、数组、指针,甚至是其他结构体。结构体成员的访问可通过直接访问和间接访问。
  结构体成员的直接访问是通过点操作符(.)访问的。点操作符接受两个操作数,左操作数就是结构体变量的名字,右操作数就是需要访问的成员的名字。这个表达式的结果就是指定的成员。同时需注意下标引用和点操作符具有相同优先级,结合性都是从左向右。如:x.a
  当你拥有一个指向结构的指针,那么你应该对指针进行间接访问操作,然后再使用点操作符来访问结构体成员。但点操作符的优先级高于间接访问操作符,所以必须带上括号,确保间接访问先执行。如:(*z).b。如果你觉得这样写太麻烦,你可以使用箭头操作符(->),和点操作符一样,箭头操作符接受两个操作数,但左操作数必须是一个指向结构的指针。箭头操作符对左操作数执行间接访问取得指针指向的结构,然后和点操作符一样,根据右操作数选择一个指定的结构成员。如:z->b;

3.结构的自引用

struct Node
{
    int data;
    struct Node next;
};

  容易发现上述代码不可行,因为成员next是另一个完整的结构体,其内部还将包含它自己的成员next。这第二个成员又是一个完整的结构体,它还将包含它自己 的成员next。这样重复下去无法衡量开辟了多少空间。
  正确的自引用方式:

struct Node
{
    int data;
    struct Node* next;
};

结论:结构体内部不可包含本身的结构体变量,但可包含本身的结构体指针变量。

4.结构体内存对齐

typedef struct {
        int a;
        short b[2];
}Ex2;
typedef struct EX{
        int a;
        char b[3];
        Ex2 c;
        struct EX *d;
}Ex;

以上类型为EX的结构可以用下图表示:
结构

那么具体结构体内存对齐方式如何呢?
首先我们得掌握结构体的对齐规则:
  1. 第一个成员在与结构体变量偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
  对齐数 = 编译器默认的一个对齐数(因平台而异) 与 该成员大小的较小值
  VS中默认的值为8
  Linux中的默认值为4

  3. 结构体总大小为最大对齐数(每个成员变量除了第一个成员都有一个对齐数)的整数倍。
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

struct S1
{
    char a;
    int b;
    char c;
};

struct S2
{
    int b;
    char a;
    char c;
};

S1的在内存中的存储如下:
结构

S2的在内存中的存储如下:
结构

  明显S1在内存中分配了12个字节,S2在内存中分配8个字节,节省了33%的空间,那为什么不直接使用S2的方式呢?有时,我们有充分的理由,决定不对结构体的成员进行重排以减少因对齐带来的空间损失。例如,我们可能想把相关的结构成员存储在一起,提高程序的可维护性和可读性。但是,如果不存在这样的理由,结构的成员应该根据他们的边界需要进行重排,减少因边界对齐而造成的内存损失。
  有时候当结构体数量很大时,减少内存浪费的要求要比程序的可读性更为重要,在这种情况下,在声明中增加注释可能避免可读性方面的损失。

讲了这么多,那么为什么存在内存对齐?
1. 平台原因(移植原因):
  不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
  数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:
  结构体的内存对齐是拿空间来换取时间的做法。若既要满足对齐,又要节省空间,就需让占用空间小的成员尽量集中在一起。
注:结构体第一个成员不用对齐但有对齐数。

5.结构体传参

struct S 
{ 
    int data[1000]; 
    int num; 
}; 
struct S s = {{1,2,3,4}, 1000}; 
//结构体传参
void print1(struct S s) 
{ 
    printf("%d\n", s.num); 
} 
//结构体地址传参
void print2(struct S* ps) 
{ 
    printf("%d\n", ps->num); 
} 

int main() 
{ 
    print1(s); //传结构体
    print2(&s); //传地址
    return 0; 
} 

  结构体传参时最好采用传址方式,因为函数传参的时候,参数是需要压栈的。 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。向函数传递指针同样是有缺陷的,缺陷在于可以对调用程序的结构变量进行修改,如果我们不希望如此,可以在函数中使用const关键字来防止这样的修改。

6.位段

位段的声明和结构是类似的,有两个不同:
  1.位段的成员必须是 int、unsigned int 或signed int 。
  2.位段的成员名后边有一个冒号和一个整数,这个整数指定该位段所占用的位的数目。
比如:

struct A 
{ 
    int _a:2; 
    int _b:5;  
    int _c:10; 
    int _d:30; 
}; 

在32位平台机器上有以下两种存储方式:
内存

内存

位段的内存分配:
  1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
注意:
  注重可移植性的程序应该避免使用位段。由于下面的跨平台问题,位段在不同的系统中可能有不同的结果。
  1. int位段被当成有符号数还是无符号数是不确定的。
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写
成27,在16位机器会出问题。)
  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
  跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平
台的问题存在。

联合

  联合也是一种特殊的自定义类型。联合的声明的结构体类似,但它的行为方式却和结构不同。联合的所以成员引用的是内存中的相同位置。当你想在不同的时刻把不同的东西存储于同一个位置时,就可以使用联合。
联合的特点:
  联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
利用联合可以判断当前计算机的大小端存储

int check_sys()
{
    union
    {
        int i;
        char c;
    }un;
    un.i = 1;
    return un.c;
}
int main()
{
    int ret = check_sys();
    if(ret == 1)
    {
        printf("小端\n");
    }
    else
    {
        printf("大端\n");
    }
    return 0;
}

联合大小的计算:
  1.联合的大小至少是最大成员的大小。
  2.当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

枚举

枚举顾名思义就是一一列举。
把可能的取值一一列举。
枚举类型的定义:

enum Day   //星期
{ 
    Mon,     //0
    Tues,    //1
    Wed,     //2
    Thur,    //3
    Fri,     //4
    Sat,     //5
    Sun      //6
}; 

enum Sex   //性别
{ 
    MALE,    //0
    FEMALE,  //1
    SECRET   //2
};

enum Color  //颜色
{ 
    RED,     //0
    GREEN,   //1
    BLUE     //2
}; 

以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。
  {}中的内容是枚举类型的可能取值,也叫枚举常量 。这些可能取值都是有值的,默认从0开始,依次递增1,当然在定义的时候也可以赋初值。

枚举的优点:
  1. 增加代码的可读性和可维护性
  2. #define定义的标识符比较枚举有类型检查,更加严谨。
  3. 防止了命名污染(封装)
  4. 便于调试
  5. 使用方便,一次可以定义多个常量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值