文章重点:1.数据类型详细介绍 2.整形在内存中的存储 3.大小端字节序介绍及判断(将会在下一节文章中介绍浮点型在内存中的存储)
1.数据类型的详细介绍:
c语言中基本的内置类型有:
char:字符数据类型 short:短整型 int:整形 long:长整型 long long:更长的整形 float:单精度浮点数 double:双精度浮点数
如果想要知道它们所占存储空间的大小,可以在编译器上运行如下代码:
其中sizeof是一个操作符,是用来计算操作数的类型长度,并且是以字节为单位的。
在C语言标准中规定了这么多的数据类型,那它们的意义是什么呢?
1.使用这个类型所开辟内存空间的大小。(大小决定了使用的范围)
2.类型决定了我们去看待内存空间的视角。
1.1类型的基本归类:
数据类型有两大家族,一是整形家族,另一个则是浮点数家族。
首先,整形家族中有char、short、int、long。浮点型家族中有float和double两类。
我们可能会有疑惑,char不是一个字符数据类型吗?它为什么会被归类在整形家族中呢?这是因为计算机在内存中存储的是char类型所对应的ASCII值,并不是这个字符本身。
在整形家族中,当我们在划分的细致一点时,每一种类型都对应的有有符号类型和无符号类型。
char:分为signed char 和unsigned char short: 分为signed short和unsigned short
int: 分为signed int 和unsigned int long :分为signed long和unsigned long
在C99标准规定中,为详细声明的int、short和long均指的是有符号的类型,即signed int、signed short和signed long。但是标准并未定义未详细声明的char是否为signed char类型的。但是在大多数编译器中,都可以看出编译器char类型的默认为signed char,即有符号的char类型(如何看出来将会在后面用代码来展现)。
2.整形在内存中的存储:
我们知道一个变量的创建是要在内存中开辟空间的。空间的大小又是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟的内存中是如何存储的呢?
比如:
int a = 20;
int b = -10;
我们知道为a分配四个字节的空间。那到底是如何存储的呢?先来了解一个如下概念:
2.1 原码、反码、补码
计算机中整数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,数值位就是整数转化为二进制后所对应的数字。
负整数的三种表示方法各不相同。
原码:
直接将负整数转换为相对应的二进制序列就可以得到。
反码:
将原码的符号位不变,其他位依次按位取反。
补码:
反码+1就得到了补码。
正整数的原、反、补码都相同。
对于整形来说,数据存放在内存中的实际上是其相对应的补码。
为什么不存储相对应的原码或者反码来存储呢?
在计算机系统中,数值一律都用补码来表示和存储。原因在与,使用补码,可以将符号位和数值位统一处理。
同时,加法和减法也可以统一处理(CPU只有加法器)。此外,补码与原码相互转换,其运算过程是相同的不需要额外的硬件电路。
举个例子:先假设计算机中存储的是原码:
int a=1;
int b=-1;
int c=a+b;
a在内存中对应的原码:
00000000000000000000000000000001
b在内存中对应的原码:
10000000000000000000000000000001
当二者相加时,得到的c的二进制序列为:
10000000000000000000000000000010
如果计算机中存储的就是数据的原码,则c所对应的这段原码翻译成十进制数据就是:-2。
所以,在假设计算机中存储的是原码时,1+(-1)的结果是(-2)。
显然,这是不符合逻辑的。
再来以计算机中存储的是数据的补码来进行测试:
int a=1;
int b=-1;
int c=a+b;
a的原码是:
00000000000000000000000000000001
因为a是正数,所以其原、反、补相同。
b的原码是:
10000000000000000000000000000001
反码:
11111111111111111111111111111110
补码:
11111111111111111111111111111111
当a与b相加时,即将其在计算机中存储的序列相加得到:
00000000000000000000000000000000
该二进制对应的十进制便是0
所以:1+(-1)=0
符合我们通常的运算逻辑!!!
3.大小端字节序及判断
#include<stdio.h>
int main()
{
int a=20;
int b=-10;
return 0;
}
在编译器上写下上述代码后会打开监视中的窗口会显示出a和b是在内存中存储的内容:
a:14 00 00 00
b:f6 ff ff ff
由此我们可以更加确定,a和b在内存中分别存储的是补码。但是我们发现顺序有点不太对劲。
由此引出大小端介绍:
什么是大小端:
大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式:是指数据的低位保存的内存的底地址中,而数据的高位,保存在内存的高地址中。
为什么会有大端和小端:
为什么会有大端和小端之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应一个一个字节,一个字节为8bit。
但是在C语言中8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
eg:一个16bit的short型x,在内存中的地址位:0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节,对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式刚好相反。我们常用的X86结构是小端模式。