深度剖析数据在内存中的存储—

验证我们创建的num变量在VS这个编译器上是如何存放的，在VS这个编译器上，为了方便展示，显示的是十六进制，如上图，因为我们这里设置的是32位，也就是32个比特位，32个二进制的数转换成十六进制，四个二进制位换成一个16进制位，也就转换成8位16进制的数，num的补码换成16进制的数就为0x 00 00 00 0a，num2的补码换成16进制的数就为

0x ff ff ff f6。但是存进去之后我们发现是倒着存储的，这是为什么呢？这就涉及到大小端的问题，接下来，我们来学习一下大小端字节序。

2.2 大小端字节序

大小端存储的定义

正如刚刚说说，当我们知道，计算机存储一个整型数据，是将这个整形数据的补码存放在内存中的，但是我们发现，存储的时候是倒着存储的，这是为什么呢？这是就要学习一个概念，大端和小端

大端（存储）模式：数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；

小端（存储）模式：数据的低位保存在内存的低地址中，而数据的高位，保存在内存的高地址中；

为什么会有大小端字节序之分呢？

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short 型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32 位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为 高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高 地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则 为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。

怎么判断一个当前机器的大小端

其实我们可以通过调试的方法直接去看的。如下图

当然我们可以写个代码（程序）去测试当前机器是大端还是小端

假设有个int变量a，大小为1，写成16进制就是0x 00 00 00 01，那么存到内存中也就两种情况，如下图所示，仔细对比一下我们会发现，我们只要对比第一个字节的内容，是不是就能区别出来了，如果第一个字节内容是‘1’就是小端，如果第一个字节内容是‘0’就是大端。

那么问题来了，如何拿到第一个字节的内容呢，其实也很简单，我们取地址a拿到的就是a的地址，a占四个字节，每一个字节都有地址，取地址a其实拿到的是a第一个字节的地址，类型是int*，如果对int*类型数据解引用拿到的是四个字节，但是当我们把int*的数据强制类型转换成char*类型的数据后，再解引用，拿到（访问）的就是一个字节的地址，这时候再进行判断，也就实现我们的目的了。具体代码如下

int main()
{
	int a = 1;
	int* pa = &a;//取出a的地址-int*类型
	char* p = (char*)pa;//强制类型转换成char*类型
	if (*p == 1)//在解引用进行判断
		printf("小端");
	else
		printf("大端");
	return 0;
}

2.3 有符号和无符号的区别

对整型家族来说，有有符号和无符号的区别，拿int 来举例，分为unsigned int(无符号)和signed int(有符号)。

注意：①我们平时直接写的int short 以及long其实都是有符号的，只是把signed给省略了，但是如果要写无符号，不能省略unsigned

② char比较特殊，我们平时写的char到底是signed char还是unsigned char不确定，C语言标准没有给出明确规定，这时就取决于编译器的实现，通常我们见到的编译器下(如VS)一般来说，char指的都是signed char。

那么具体的区别是什么呢？

就拿char举例，char是一个字节，也就是八byte，当是signed char的时候，是有符号数，存在符号位的，也就把最高位当作符号位，符号位为‘0’时，就是正数，符号位为‘1’时就是负数。当是unsigned char的时候，是无符号数，也就没有符号位，把八个byte全部当作数值位来看待。同理int short long都是一样的。

讲到这里，有些同学会有一些疑问，一个有符号char的表示范围是多少呢？一个无符号char的表示范围又是多少呢？

如上图所示，当我们把八个比特位的所有情况全部写出来后，我们就可以以此计算。

注意：①最高位是符号位 ②10000000表示的是-128

同理可以算出unsigned char的表示范围。由此可见signed char的表示范围位-128——127，signed char 表示的范围为0——255。

三、浮点型在内存中的存储

常见的浮点数：3.14159

1E10（1.0×10^10）

浮点数家族包括：float double long double

浮点数也是有限制范围的，在float.h这个头文件中

我们先来看一串代码的运行结果吧

由上图我们可以得出浮点数在内存的存储以及取出的形式与整型是不同的，是有差异的。那具体是怎么存储的呢？

浮点数的存储规则

根据国际标准 IEEE （电气和电子工程协会） 754 ，任意一个二进制浮点数 V 可以表示成下面的形式：

(-1)^S * M * 2^E

(-1)^S表示符号位，当 S=0 ， V 为正数；当 S=1 ， V 为负数。

M表示有效数字，大于等于1 ，小于 2 。

2^E表示指数位。

举例来说：

十进制的 5.0 ，写成二进制是 101.0 ，相当于 1.01×2^2 。

那么，按照上面 V 的格式，可以得出 S=0 ， M=1.01 ， E=2 。

十进制的 -5.0 ，写成二进制是 - 101.0 ，相当于 - 1.01×2^2 。那么， S=1 ， M=1.01 ， E=2 。

IEEE 754 规定：

对于 32 位的浮点数，最高的 1 位是符号位 S ，接着的 8 位是指数 E ，剩下的 23 位为有效数字 M 。

对于 64 位的浮点数，最高的 1 位是符号位S，接着的 11 位是指数 E ，剩下的 52 位为有效数字 M 。

IEEE 754 对有效数字 M 和指数 E ，还有一些特别规定。

前面说过， 1≤M<2 ，也就是说， M 可以写成 1.xxxxxx 的形式，其中 xxxxxx 表示小数部分。

IEEE 754 规定，在计算机内部保存 M 时，默认这个数的第一位总是 1 ，因此可以被舍去，只保存后面的 xxxxxx部分。

比如保存 1.01 的时候，只保存01 ，等到读取的时候，再把第一位的 1 加上去。这样做的目的，是节省 1 位有效数字。以 32 位浮点数为例，留给M 只有 23 位将第一位的1 舍去以后，等于可以保存 24 位有效数字。

至于指数 E ，情况就比较复杂。

首先， E 为一个无符号整数（ unsigned int ）

这意味着，如果E 为 8 位，它的取值范围为 0~255 ；如果 E 为 11 位，它的取值范围为 0~2047 。但是，我们知道，科学计数法中的E 是可以出现负数的，所以IEEE 754 规定，存入内存时 E 的真实值必须再加上一个中间数，对于 8 位的 E ，这个中间数是127 ；对于 11 位的 E ，这个中间数是1023 。比如， 2^10 的 E 是 10 ，所以保存成 32 位浮点数时，必须保存成 10+127=137 ，即10001001。

然后，指数 E 从内存中取出还可以再分成三种情况：

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

比如：

0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为

1.0*2^(-1)，其阶码为-1+127=126，表示为 01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000000000000000000，

则其二进制表示形式为: 0 01111110 00000000000000000000000

E全为0