数据在内存中的存储

最新推荐文章于 2024-09-04 21:39:45 发布

wheeldown

最新推荐文章于 2024-09-04 21:39:45 发布

阅读量838

点赞数 33

文章标签： c语言开发语言算法 c++ 数据结构

本文链接：https://blog.csdn.net/wheeldown/article/details/139455510

版权

数据的类型有很多如：短整型，整型，单精度浮点型，双精度浮点型........，如此多的类型，各个类型在内存中的存储的方式也有所不同，调用内存计算时进行的各个步骤也有可能不同。本文将通过整型，浮点型两大种类型来进行探讨数据在内存中的如何存储。

序章：储备知识

在讲内存存储之前我们需要先了解一个非常非常重要的知识，它是我们贯穿本文的关键所在。

我们一定了解过二进制，所以在二进制的定义和转换本文不详细讲解，先知道它是只有0和1的世界就好。

接下来就是重要嘉宾：

原码，反码，补码

原码：直接将数值按照正负数的形式翻译成⼆进制得到的就是原码。
反码：将原码的符号位不变，其他位依次按位取反就可以得到反码。
补码：反码+1就得到补码。

注意：正整数的原码、反码、补码都相同

负数的原码、反码、补码需要按照规则进行转换

例如： 10的原码、反码、补码

（十进制）10=（二进制）00000000 00000000 00000000 00001010（原码）

00000000 00000000 00000000 00001010（反码）

00000000 00000000 00000000 00001010（补码）

-10的原码、反码、补码

（十进制）-10=（二进制）10000000 00000000 00000000 00001010（原码）

11111111 11111111 11111111 11110101（反码）

11111111 11111111 11111111 11110110（补码）

以上就是原码、反码、补码的转换，贯穿本文的关键。

1.整数在内存中的存储

首先，我们讨论一个问题，整数是把以哪种码放在内存里的？？？

对于整形来说：数据存放内存中其实存放的是补码。

为什么呢？？？

在计算机系统中，数值⼀律⽤补码来表⽰和存储。
原因在于，使⽤补码，可以将符号位和数值域统⼀处理；
同时，加法和减法也可以统⼀处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

简单来说，原码对于cpu来说并不是很好处理，因为cpu只有加法器，但是通过补码进行操作，之后再通过补码转换为原码，是一种简洁、迅速的操作。更不需要额外的硬件电路，来进行减法操作。

但是说了怎么多，到底是怎么存储的哪？？？

我们不妨设计一组代码，让结果更直观一点。

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int main()
{
	int a = 1;
	printf("%d", a);
	return 0;
}

结果显示：

嗯嗯，你说你懂了，但是有一个问题，你需要思考一下：

明明1的二进制是00 00 00 01

但是为什么放进内存的时候是倒过来放的

是01 00 00 00

这不是偶然，这是由编译器决定的大小端存储

为了防止是偶然，我们多放几组数据试试

1. a=5

2. a=6

3. a=10

第一组：

第二组：

第三组：

这里0a是16进制，16进制的a转换成10进制就是10

以上数据表明，再vs上数据类型是倒着存放的。

这就是小端字节序

2. 大小端字节序和字节序判断

我们不妨让结果更直观一点

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int main()
{
	int a = 0x11223344;
	printf("%d", a);
	return 0;
}

结果：

因为内存为了方便存储，10以上的数字用16进制转换，但是我们以16进制（0x）进行存储，结果就会跟内存一样，这样就便于分析

分析：

数字：11 22 33 44

内存：44 33 22 11

2.2什么是大小端？

其实超过⼀个字节的数据在内存中存储的时候，就有存储顺序的问题，按照不同的存储顺序，我们分为⼤端字节序存储和⼩端字节序存储，下⾯是具体的概念：

⼤端（存储）模式：是指数据的低位字节内容保存在内存的⾼地址处，⽽数据的⾼位字节内容，保存在内存的低地址处。
⼩端（存储）模式：是指数据的低位字节内容保存在内存的低地址处，⽽数据的⾼位字节内容，保存在内存的⾼地址处。

以什么样的模式进行存储数字是根据编译器决定的。

编译器决定大小端模式，同时也决定了以怎样的方式从中正确的取出数字。这也许就是能力越大，责任越大吧！！！！

2.3 为什么会有大小端？

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着⼀个字节，⼀个字节为8 bit 位，但是在C语⾔中除了8 bit 的 char 之外，还有16 bit 的 short 型，32 bit 的 long 型（要看具体的编译器），另外，对于位数⼤于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度⼤于⼀个字节，那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了⼤端存储模式和⼩端存储模式。

2.4 各种的运算方式

2.4.1 写出怎样判断编译器的大小端

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int check_big()
{
	int a = 1;
	return(*(char*)&a);
 }
int main()
{
	int ret = check_big();
	if (ret = 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

2.4.2 判断以下代码结果

#include <stdio.h>
int main()
{
 char a= -1;
 signed char b=-1;
 unsigned char c=-1;
 printf("a=%d,b=%d,c=%d",a,b,c);
 return 0;
}

解析：

为什么会出现这样的结果哪？

-1补码：11111111 11111111 11111111 11111111

a的结果：因为a的字符类型是1个字节，8个bite位

所以存进a的bite位是：11 11 11 11

因为不够32位，所以要进行整型提升

11 11 11 11

最前面一位是1，所以前面的几十位全补1

11111111 11111111 11111111 11111111

但是只是补码

由补码转回原码

1000 0000 0000 0000 0000 0000 0000 0001

所以%d打印的是原码

b的结果：因为是有字符char类型，跟上述一样。

c的结果：

-1补码：11111111 11111111 11111111 11111111

a的结果：因为a的字符类型是1个字节，8个bite位

所以存进a的bite位是：11 11 11 11

因为不够32位，所以要进行整型提升

11 11 11 11

但是这里的整型提升跟上面不一样

因为是无符号的原因

要补0

00 00 00 00 00 00 00 00 00 00 00 00 11 11 11 11

由于第一位符号位是0，所以原码、反码、补码相同

转化为10进制就是255；

由于篇幅原因，各种类型的运算，会专门出一个章节。

3.浮点数在内存中的存储

常⻅的浮点数：3.14159、1E10等，浮点数家族包括： float、double、long double 类型。浮点数表⽰的范围： float.h 中定义

根据国际标准IEEE（电⽓和电⼦⼯程协会） 754，

任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式：

V = (−1) ∗ S M ∗ 2E • (−1)

S 表⽰符号位，当S=0，
V为正数；当S=1，V为负数 • M 表⽰有效数字，
M是⼤于等于1，⼩于2的 • 2 E 表⽰指数位
⼗进制的5.0，写成⼆进制是 101.0 ，相当于 1.01×2^2 。
那么，按照上⾯V的格式，可以得出S=0，M=1.01，E=2。
⼗进制的-5.0，写成⼆进制是 -101.0 ，相当于 -1.01×2^2 。那么，S=1，M=1.01，E=2。 IEEE 754规定：

上面是32位的分配空间，中间数是127，最⾼的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M

下面是64位的分配空间，中间数是1023，最⾼的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M

浮点数存储的过程

IEEE 754 对有效数字M和指数E，还有⼀些特别规定。
前⾯说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表⽰⼩数部分。
IEEE 754 规定，在计算机内部保存M时，默认这个数的第⼀位总是1，因此可以被舍去，只保存后⾯的 xxxxxx部分。
⽐如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的⽬的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第⼀位的1舍去以后，等于可以保存24位有效数字。
⾄于指数E，情况就⽐较复杂
⾸先，E为⼀个⽆符号整数（unsigned int）这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的
所以IEEE 754规定，存⼊内存时E的真实值必须再加上⼀个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。⽐如，2^10的E是 10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1

浮点数就采⽤下⾯的规则表⽰，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第⼀位的1。

⽐如：

0.5 的⼆进制形式为0.1，由于规定正数部分必须为1，即

将⼩数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表⽰为01111110，

⽽尾数1.0去掉整数部分为0，补⻬0到23位 00000000000000000000000，

则其⼆进制表⽰形式为: 1 0 01111110 00000000000000000000000

E全为0

浮点数的指数E等于1-127（或者1-1023）即为真实值

有效数字M再加上第⼀位的1，⽽是还原为0.xxxxxx的⼩数。

这样做是为了表⽰±0，以及接近于0的很⼩的数字。 1 0 00000000 00100000000000000000000 E

全为1 这时

如果有效数字M全为0，表⽰±⽆穷⼤（正负取决于符号位s）； 1 0 11111111 00010000000000000000000 关于浮点数的表⽰规则，就说到这⾥

wheeldown

关注

33
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
1
评论
数据在内存中的存储

⼤端（存储）模式：是指数据的低位字节内容保存在内存的⾼地址处，⽽数据的⾼位字节内容，保存在内存的低地址处。⼩端（存储）模式：是指数据的低位字节内容保存在内存的低地址处，⽽数据的⾼位字节内容，保存在内存的⾼地址处。以什么样的模式进行存储数字是根据编译器决定的。编译器决定大小端模式，同时也决定了以怎样的方式从中正确的取出数字。这也许就是能力越大，责任越大吧！！！！
复制链接

扫一扫