数据在内存中的储存

最新推荐文章于 2024-10-05 22:19:52 发布

卡卡罗特mmmmm

最新推荐文章于 2024-10-05 22:19:52 发布

阅读量1.6k

点赞数 49

文章标签：算法

本文链接：https://blog.csdn.net/2401_83906677/article/details/139502120

版权

1整数在内存中的储存

在讲解操作符的时候，我们就讲过了下面的内容：

整数的2进制表示方法有三种，即原码，反码，补码

有符号的整数，三种表示方法均有符号位和数值位两部分，符号位都是用0表示正，用1表示负，最高的一位是被当做符号位，剩余的都是数值位。

正整数的原，反，补码都有相同。负整数的三种表示方法各不相同。

原码：直接将数值按照正负数的形式翻译成二进制得到的就是原码。 反码：将原码的符号位不变，其他位依次按位取反就可以得到反码。 补码：反码加一就得到补码。

对于整形来说：数据存放内存中其实存放的是补码。

原因在于：使用补码，可以将符号位和数值域统一处理；

同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与反码相互转换，其运算过程是相同的，不需要额外的硬件电路。

2大小端字节序和字节序判断

当我们了解了整数在内存中存储后，我们调试看一个细节：

调试的时候，我们可以看到在a中的0x11223344这个数字是按照字节为单位，倒着储存的。这是为什么呢？

2.1什么是大小端？

其实超过一个字节的数据在内存中储存的时候，就有储存顺序的问题，按照不同的储存顺序，我们分为大端字节序储存和小段字节序储存，下面是具体的概念：

大端（储存）模式：

是指数据的低位字节内容保存在内存的高地址处，而数据的高位字节内容，保存在内存的低地址处。

小端（储存）模式：

是指数据的低位字节内容保存在内存的低地址处，而数据的高位字节内容，保存在内存的高地址处。

上述概念需要记住，方便分辨大小端。

2.2为什么有大小端？

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit位，但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端储存模式和小端存储模式。

例如：一个16bit的short型x，在内存中的地址为0x0010，x的值为0x1122，那么0x11位高字节，0x11为低字节。对于大端字节，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反。我们常用的x86结构是小端模式，而KEIL C51则为大端模式。很多ARM，DSP都为小端模式。有些ARM处理器还可以有硬件来选择是大端模式还是小端模式。

2.3练习

2.3.1练习一

在知道有数据存储有大小端之后，如何判断当前字节序呢？

整数1在内存中的储存有两种方式：

我们可以将整数1的地址强转成char*,再进行读取若结果为1，则为小段字节，若结果为0，则为大端字节。

代码如下：

#include<stdio.h>
int main() 
{
	int a = 1;
	if (*(char*)&a == 1)
		printf("小段");
	else if (*(char*)&a == 0)
		printf("大端");
	return 0;
}

结果如下：

可以看到，在vs2022的环境下为小端字节序储存。

2.3.2练习二

int main()
{
	char a = -1;
	signed char b = -1;
	unsigned char c = -1;
	printf("a=%d,b=%d,c=%d", a, b, c);
	return 0;
}

结果是

a=-1,b=-1,c=255

分析：char类型是有符号还是无符号的呢？

在大部分编译器中char都是有符号的，在vs2022中也是。

-1是整形，储存在char型变量a中要发生截断，-1的补码是11111111111111111111111111111111储存在a中的补码是11111111，打印成%d，要进行补位，a是有符号的，补第一个符号位，也就是11111111111111111111111111111111，转换成原码就是-1；
signed char b的情况跟char a是一样的，所以结果也是-1；
-1储存在unsigned char c中储存的也是11111111，打印成%d，进行补位，c是无符号的，直接补0；也就是00000000000000000000000011111111，转换成原码也就是255.

2.3.3练习三

代码是：

int main()
{
	char a = -128;
	printf("%u\n", a);
	return 0;
}

结果：

4294967168

分析：

-128的补码是11111111111111111111111110000000 ，存在char型变量a中发生截断变成10000000，打印成无符号整数%u，进行补位，a是有符号的，补第一个符号位，也就是11111111111111111111111110000000，转换成补码4294967168。

2.3.4练习四

代码：

int main()
{
	char a = 128;
	printf("%u\n", a);
	return 0;
}

结果：

4294967168

128的补码是00000000000000000000000010000000 ，存在char型变量a中发生截断变成10000000，打印成无符号整型%u，进行补位，a是有符号的，补第一个符号位，也就是11111111111111111111111110000000，转换成补码4294967168。

2.3.5练习五

代码：

int main()
{
	signed int a = -128;
	unsigned int b = -128;
	printf("%u  %d\n", a, a);
	printf("%u  %d", b, b);
	return 0;
}

结果：

4294967168  -128
4294967168  -128

分析：可以看到无论是用有符号整型还是无符号整型来储存-128；打印结果都是一样的，也就是说储存在内存中的补码都是11111111111111111111111110000000，只是在使用时打印的是%u还是%d才有区别。

2.3.6练习六

代码：

int main()
{
	char arr[1000];
	for (int a = 0; a < 1000; a++)
	{
		arr[a] = -1 - a;
	}
	printf("%zd", strlen(arr));
	return 0;
}

结果：

分析：char型变量的取值范围是-128到127；127+1又会变成-128；而strlen统计的是\0之前的元素个数，arr中存放的元素为-1，-2，·······，-128，127，126，········1，0，循环到1000个，而第一个0前面的元素个数为255.

2.3.7练习七

代码：

unsigned char a = 0;
int main()
{
	for ( a = 0; a <= 255; a++)
	{
		printf("hello word\n");
	}
	return 0;
}

结果：

无限循环打印hello word。

分析：因为 unsigned char类型变量的取值范围是0~255，255+2又变成0，因此a<=255的条件恒成立，因此无限循环打印hello world。

2.3.8练习八

代码在x86环境下：

int main()
{
	int a[4] = { 1,2,3,4 };
	int* str1 = (int*)(&a + 1);
	int* str2 = (int*)((int)a + 1);
	printf("%x  %x", str1[-1], *str2);
	return 0;
}

结果：

4  2000000

分析：

数组在内存中的储存情况：

&a+1会指向数组后面的位置强转成int*，因此str[-1]=*(str-1),指针的变化如下：

因此第一个打印结果为4 。

a是数组第一个元素的地址转化成int+1，在转化成int*，str2指向：

因此打印结果为20000000。

3浮点数在内存中的储存

常见的浮点数：3.14159.1E10等，浮点数家族包括：float，doule，long double类型。

浮点数表示的范围：float.h中定义

3.1浮点数的储存

根据国际标准IEEE754,任何一个二进制数v可以表示成下面的形式：

举例来说：十进制的5.0，写成二进制是101.0，相当与1.01*2的2次方。

那么，按照上面的格式，得出s=0，m=1.01，E=2.

十进制的-5.0，二进制就是-101.0，相当于-1.01*2的2次方。

那么，s=1，m=1.01，E=2.

IEEE 754规定：

对于32位的浮点数，最高的1位储存符号位s，接着的8位储存指数E，剩下的23位储存有效数字M.

对于64位的浮点数，最高的1位储存符号位s，接着的11位储存指数E，剩下的52位储存有效数字M.

3.1.1 浮点数存的过程

IEEE 754对有效数字M和指数E，还有一些特别规定。

前面说过，1<=M<2, 也就是说，M可以写成1.xxxxxx的形式，其中xxxxxx表示小数部分。

IEEE 754 规定，在计算机内部保存M的时候，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。

至于指数E，情况比较复杂

首先E是一个无符号整数，这意味着，如果E为8位，它的取值范围为0~255；如果为11位，取值范围为0~2047.但是，科学计数法中的E是可以出现负数的，所以IEEE754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，中间的数时127；对于11位的E，这个中间数是1023.

3.1.2浮点数读取的过程

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

E全为0

这时，浮点数的指数E等于1-127（或1-1023），即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示正负0，以及接近于0的很小的数字。

E全为1

这时，如果有效数字M全为0，表示正负无穷大（政府取决于符号位s）。

卡卡罗特mmmmm

关注

49
点赞
踩
52

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫