深度剖析数据在内存中的存储——int类型(整型)和float类型(浮点数)在内存中是如何存储和使用的？

最新推荐文章于 2024-07-16 18:16:45 发布

_Fiora

最新推荐文章于 2024-07-16 18:16:45 发布

阅读量2k

点赞数 33

分类专栏： C语言文章标签：开发语言 c++ c语言数据结构

本文链接：https://blog.csdn.net/qq_43188955/article/details/129803488

版权

C语言专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

1.引言
2.正文

1.引言

众所周知，C语言中有几种基本的内置数据类型：

char - 字符数据类型
short - 短整型
int - 整型
long - 长整型
long long - 更长的整型
float - 单精度浮点数
double - 双精度浮点数

那为什么要设置这么多内置数据类型呢？类型的意义是什么？
本文将为大家介绍整型和浮点数在内存中的存储模式和使用方法。

2.正文

1.1类型的归类和意义

本文主要讲解整型和浮点数，其他类型大家感兴趣可以自行了解
整型家族：

signed char
unsigned char
signed short
unsigned short
signed int
unsigned int
signed long
unsigned long

其中char虽然是字符类型，但是字符类型在存储的时候，其实存储的是字符的ASCII码值，ASCII码值是整数，所以char也是整型家族的。
signed表示的是有符号的类型，如：signed int a;
unsigned表示的是无符号的类型，如：unsigned int b;
有正负的数据可以存放在有符号的变量中，只有正数的数据可以存放在无符号的变量中。
浮点数家族：

float
double

这么多数据类型的意义到底是什么呢？
第一，数据类型决定了使用这个类型开辟内存空间的大小，而大小又决定了使用范围。
第二，决定了如何看待内存空间的视角。
大家可能不太好理解这些抽象的知识点，接下来我就给大家通过举例子的方法详细介绍。

1.2整型在内存中的存储

有符号数在计算机中有三种表示方法，即原码、反码、补码。

三种方法的最高位都为符号位：0正1负，其他位都是数值位。
原码就是直接将该数据以正负的形式转化为二进制。
反码就是原码的符号位不变，其他位按位取反。
补码，反码+1就得到了补码。

整型在内存中实际存储的是该数据的补码的二进制。
所以我们在存储时应该先将十进制的数字转换为二进制的原码，然后按规则存储，最终存储的是补码。

值得一提的是，正数和无符号数的原反补码相同，所以只有负数需要通过原码计算求得补码。而且无符号数的最高位不是符号位，也是数据位。

例如：int a = -1;
此时我们要将-1存进int类型的a中，首先应该将-1转化为二进制，得到原码
-1的原码：10000000000000000000000000000001
再通过原码求得-1的反码和补码。
-1的反码：1111111111111111111111111111111111110
-1的补码：1111111111111111111111111111111111111
补码也就是这里a在内存中实际存储的数据。

1.2.1例

如果大家还是不理解，我再给大家举一个更全面，更复杂的例子。

int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a = %d, b = %d, c = %u", a, b, c);
return 0;
}

这里我先给大家扩展几个个知识点：
%d是打印有符号整型，意思是打印的一定是有符号整型，从计算机的视角来看，即使不是有符号数，他也会认为是有符号数。
%u是打印无符号整型，意思是打印的一定是无符号整型，从计算机的视角来看，即使不是无符号数，他也会认为是无符号数。
如果把一个负数强行存储在unsigned类型中，当使用%d打印时，即使符号位有正负也会被认为是数据。

那这里的代码结果是什么呢？a，b，c的值分别是多少呢？
运行代码，我们来看结果。

1.2.2解析

结果是a=-1，b=-1，但c却是255，这是什么原因？
让我来为大家一步一步解析。

第一步，要存储-1的值，就必须先算出-1的原码，反码，补码，最终把补码存进内存中.
-1的原码：10000000000000000000000000000001
-1的反码：11111111111111111111111111111110
-1的补码：11111111111111111111111111111111
此时要将这32位的数据存进char类型的a中，但char最多能存储8位的数据，强行存储就会发生截断，实际a存进去的是11111111(优先存储低地址)，b和c同理。(a和b本质是相同的，以下就拿c来讲解)

第二步，这里要以%d、%d、%u的形式来分别打印a，b，c。上面给大家说过，%d和%u都是打印整型的，而这里的a，b，c都是char类型，使用的时候就要发生整型提升，整型提升的规则是，负数就补符号位，正数就补0，无符号数也补0。

第三步，c发生整型提升(a,b也会)，c的类型是unsigned char，是无符号数，所以高位补0。
得到整型提升后的补码：00000000000000000000000011111111

第四步，c是以%u的形式打印的，也就是打印无符号数，所以此时的补码就等于原码。而这里的补码换算为十进制，就是255，所以c打印出的值是255。

讲到这里我相信在座的各位都已经彻底理解了整型在内存中是如何存储的。

1.3大小端

这里再为大家补充一个知识点，大小端存储模式。
什么是大小端？

大端存储模式：数据的高位保存在内存的低地址处，低位保存在内存的高地址处。
小端存储模式：数据的低位保存在内存的低地址处，高位保存在内存的低地址处。

比如：int a = 0x11223344；在小端存储模式的编译器里，内存中的地址为44332211，在大端存储模式的编译器里，内存中的地址为11223344。
本人使用的是VS2019，此处通过调试来测试VS2019的存储模式。

可以看出，VS2019采用的是小端存储模式。

那为什么要有大小端存储模式呢？
这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着1个字节。
1个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器）。
另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于1个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

1.4浮点数在内存中的存储

首先我们必须要知道的是，浮点数和整型在内存中的存储方式是不同的。

1.4.1浮点数存储

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数可以表示成下面的形式：

(-1)^S × M × 2^E
其中，(-1)^S表示符号位，当S=0时，为正数，当S=1时，为负数。
M表示有效数字，大于1，小于2.
2^E表示指数位。

存储时：

对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。
对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。
M：在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分(1.xxxxxx)
E：首先，E是一个无符号整数。
存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。

例如：float a = 5.5，5.5写成二进制就是101.1，也就是1.011×2^2，按照上面的公式可以得出，S=0，M=1.011，E=2。
E+127 = 129，129的二进制是10000001
所以此时内存中存储的应该是：0 10000001 01100000000000000000000
换算成16进制就是0x40b00000，我们来测试一下，看是不是这样的。

取出时：

分为三种情况：
1 - E不全为0或不全为1：指数E的计算值减去127(或1023)，得到真实值，再将有效数字M前加上第一位的1。也就是存储时的操作反过来操作回去。
2 - E全为0：浮点数的指数E等于1-127(或者1-1023)即-126，即为真实值。
有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。
3 - E全为1：如果有效数字M全为0，表示±无穷大(正负取决于符号位S)。