c语言中自定义类型

目录

一、结构体

结构体的定义:

结构体的大小计算

结构体大小的练习题(编译器默认的对齐数为8):

内存对齐的意义在哪?

二、位段

什么是位段?

位段的内存分配

不跨平台的原因:

三、枚举类型

枚举的优点 为什么使用枚举?

枚举的优点:

枚举的使用

四、联合体(公用体)

联合类型的定义

与结构体的区别

联合体的特点

联合大小的计算


一、结构体

结构体的定义:

结构体(struct)是由一系列具有相同类型或不同类型的数据构成的数据集合,也叫结构

结构体是一种自定义类型,其地位与int、char等是一样的,只不过它可以根据需求自定义。

结构体可以用来描述一些复杂的具有多个特点的物体。如一本书,描述一本书你可以从很多发方面去介绍,比如书名,作者,书的价格,字数,等等。显然这里要将一本书描述得够清楚一个变量是不够的。这里就可以定义结构体了。

struct book
{
    char book_name[10];
    char author_name[10];
    int price;
}

这里结构体的其他基本使用方法不是本节主要内容故从简。

结构体的大小计算

这里结构体大小不是简单的内部变量大小相加,这里涉及到一定的存储规则。

首先我们来理解一下为什么不是内部变量的大小相加,这里如果是简单相加的话就会有下图:

即如果内存是像这样连续存放的话结构体大小就是4+1+4+2 = 11,可是事实却是这样的:

这里算出来的大小为4+4+4+4 = 16证据如下:

那么内存对齐的规则是什么呢?

 1. 第一个成员在与结构体变量偏移量为0的地址处。(偏移量是离起始地址的相对位置,这里是指第一个成员从起始位置开始排,这里很容易理解)

2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 VS中默认的值为8(这里是指,将起始地址算为0,第二个字节算为1,依次下去这里就得到了一个坐标轴。然后这句话的意思就是,特定的数据类型在特定编译器下会对应一个特定的值,这个值就决定了这个类型的数据在上述坐标中只能从具体的坐标开始排,这个特定的值叫做对齐数,大小是编译器默认大小和这个数据类型大小的较小值。比如在vsx86的环境上,int类型的大小为4个字节,比编译器默认值8要小,顾int的对齐数为4,故int类型的数据只能存放在上述坐标轴的4的倍数的位置,如4,8,12....)

这里就能解释上面例子的一些现象了:

根据2准则,这里蓝块为int类型,只能存放在4、8、12上故5、6、7要空出来

3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍(这里是指,按照2准则排放完了之后,还要看占了多少空间,如果不是最大对齐数的整数倍那么要补齐)

如这里在存放完short类型之后,占据了14个字节,这里不是最大对齐数(包含的数据中对齐数最大的那个数,这里是int 对应的4)的整数倍故要在后面补上两个字节使得其变成最大的对齐数的整数倍。

4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。(这里是考虑结构体中存在自定义类型,这里自定义类型的对齐数就是自定义类型中类型的最大对齐数)

到这里,结构体的大小就可以计算了,让我们来练习一下吧!

结构体大小的练习题(编译器默认的对齐数为8):

//练习1
struct S1
{
 char c1;
 int i;
 char c2;
};
printf("%d\n", sizeof(struct S1));

我们可以画一画图:

故为12.

struct S3
{
 double d;
 char c;
 int i;
};
printf("%d\n", sizeof(struct S3));
struct S4
{
 char c1;
 struct S3 s3;
 double d;
};
printf("%d\n", sizeof(struct S4));

故打印的第一个数为:16

我们再看第二个结构体:

故打印的第二个数为:32

让我们来看一下结果是否正确:

结果准确。

内存对齐的意义在哪?

上面讲了这么多结构体内存对齐,那么为什么要内存对齐呢?这样不是浪费了空间吗?这样的意义在哪呢?

 大部分的参考资料都是如是说的:

1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。

2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

二、位段

什么是位段?

位段的声明和结构是类似的,但是有两个不同:

1.位段的成员只要是整型就行,浮点数不行。

2.位段的成员名后边有一个冒号和一个数字(这个数字代表他所占的比特位数,其目的是为了节省空间,大小要小于其标准数据所占的比特位数)。

如:

struct A
{
 int _a:2;
 int _b:5;
 int _c:10;
 int _d:30;
};

位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 整形家族里的类型

2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。

3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段

//一个例子
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;

但是我们可以来看一看vs上面是怎样存储的:

解释:这里按照上面的存放规则有:按照需求,一个一个或者四个四个的开辟空间,故开始的时候先开辟一个字节的空间,然后再进行存入数据,在vs上面是从左边开始存入的,然后第一个字节存不进三个数据,这里就要开辟新的一个字节了,然后第一个字节中没有利用的比特位就空出来,后面也是这样的原则。于是就有上图了。故上面的结构体大小为三个字节。可是有人要问了,怎么证明是你这样的存储方式呢,比如,我为什么数据存储就要右边开始,为什么不能从左边开始呢?

这里有一个方法可以验证,即我取地址结构体变量a,然后强转为char*类型的变量,然后就for循环以%x(以十六进制)打印出来,就可以验证我上面说的对不对了。

好证据如下:

这里会发现对二进制进行转换后

就是这个数了。

这里详细列了一下位段不跨平台的原因。

不跨平台的原因:

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。

3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义(这里再vs中是从右向左)

4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的(这里在vs中是舍弃)

虽然位段不具有跨平台性,但是其还是有大用途的,想了解的铁子们可以查一查。

三、枚举类型

枚举顾名思义就是一一列举。 把可能的取值一一列举。 比如我们现实生活中:颜色,可以有红橙黄绿青蓝紫,比如尺寸,有大、中、小,比如星期,有星期一、星期二、星期三、...

碰到这些情况就可以使用另一种自定义类型——枚举类型。

enum Day//星期
{
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};
enum size//性别
{
 large;
 middle;
 small;
};
enum Color//颜色
{
 RED,
 GREEN,
 BLUE
};

枚举的优点 为什么使用枚举?

我们可以使用 #define 定义常量,为什么非要使用枚举?

枚举的优点:

1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查,更加严谨。

3. 防止了命名污染(封装)

4. 便于调试

5. 使用方便,一次可以定义多个常量

枚举的使用

枚举常量的大小如果没有初始化的话,则系统会自定义,规则是从第一个开始,逐个从小到大赋值,每个相差1,且系统默认第一个的值为0。枚举常量跟普通的常量一样不可以更改,但是可以自己在定义的时候初始化。

如:

也可以这样:

通过这幅图我相信大家已经弄清了枚举赋值的规律。接下来我们再看新的一种自定义类型——联合体。

四、联合体(公用体)

联合类型的定义

联合也是一种特殊的自定义类型 这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。

union Un
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

与结构体的区别

大家会发现,联合体长得很像结构体,就名字不太一样,其它的很像啊,那它存在的意义何在?其实它与结构体的区别主要在于它存入内存的方式不同。联合体会将其中所有的变量存入一块空间,从而达到节省空间的目的。但是达到了节省空间的目的同时,也无法避免会出现一些弊端,这里的弊端就是,变量都存入了一块空间,那么只要改变一个变量所有的变量都会跟着改变。所以由于弊端,故会出现使用条件——其中的变量不是同一时间使用。

联合体的特点

联合的成员是共用同一块内存空间的,所以所有的变量的地址是一样的,故有一下的题:

union Un
{
 int i;
 char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);

这里两个的地址是一样的,但是后面i的值就不是11223344了,而是11223355,这是由于c与i共用一块空间,所以改变c也会改变i,这里为什么是改变最后一个字节呢?这个和编译器有关,这里由于是第一块字节是重叠的,改变c是改便第一块字节,如果编译器是小端存储的,那么则改变了i的最后一个字节,如果是大端存储,那么就会改变最高位,也就是11.我这里用的是vs为小端存储,故改变最后的一个字节。

联合大小的计算

1.联合的大小至少是最大成员的大小。

2.当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

比如:

union Un1
{
 char c[5];
 int i;
};
union Un2
{
 short c[7];
 int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));

这里的结果是:

这里最大对齐数为4,故要补齐成8和16。

  • 25
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值