数据在内存中的存储

我要学编程(ಥ_ಥ)

已于 2024-03-06 22:16:11 修改

阅读量876

点赞数 28

分类专栏： C语言文章标签：算法 c语言浮点数的存储

于 2024-03-06 18:00:00 首次发布

本文链接：https://blog.csdn.net/2301_80854132/article/details/136464858

版权

C语言专栏收录该内容

49 篇文章 6 订阅

订阅专栏

个人主页（找往期文章包括但不限于本期文章中不懂的知识点）：我要学编程(ಥ_ಥ)-CSDN博客

关于char类型和short类型的取值范围

整数在内存中的存储

在学习操作符的时候，我们就学习了整数的2进制表示方法，有三种原码、反码和补码三种表示方法，均有符号位和数值位两部分组成，符号位都是用0表示正，用1表示负，而最高位的一位是被当做符号位，剩余的都是数值位。正整数的原、反、补码都相同。负整数的三种表示方法各不相同。

原码：直接将数值按照正负数的形式翻译成二进制得到的就是原码。

反码：将原码的符号位不变，其他位依次按位取反就可以得到反码。

补码：反码+1就得到补码。

直到其一可以求出另外两个。具体方法都在操作符详解（上）-CSDN博客中

对于整形来说：数据存放内存中其实存放的是补码。为什么呢？在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值位统⼀处理；同时，加法和减法也可以统⼀处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

大小端字节序和字节序判断

大小端的概念

其实超过一个字节的数据在内存中存储的时候，就有存储顺序的问题，按照不同的存储顺序，我们分为大端字节序存储和小端字节序存储，下面是具体的概念：

大端存储模式：是指数据的低位字节内容保存在内存的高地址处，而数据的高位字节内容，保存在内存的低地址处。
小端存储模式：是指数据的低位字节内容保存在内存的低地址处，而数据的高位字节内容，保存在内存的高地址处。上述概念需要记住，方便分辨大小端。

为什么有大小端

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit位，但是在C语言中除了8 bit的char 之外，还有16 bit的 short 型，32 bit的long 型（要看具体的编译器，因为C语言只是规定了long大于等于int），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如：一个 16bit 的 short型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在⾼地址中，即 0x0011 中。小端模式，刚好相反。我们常用的VS X86结构是小端模式，而KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

接下来，我们就可以看看自己的电脑是大端还是小端存储模式。

那个变量a的高字节内容是11，低字节内容是44，这个是根据二进制位翻译而来，

0001 0001 0010 0010 0011 0011 0100 0100 ，而后面44就是低权重位，也就是低字节内容了。

总结：低字节内容放在低地址处，高字节内容放在高地址处，这就意味着是小端存储。

百度笔试题

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。（10分）

字节序：以字节为单位，讨论储存顺序。

大端字节序：数据在存储的时候，把高位字节内容放在低地址处，把低位字节内容放在高地址处。

小端字节序：数据在存储的时候，把低位字节内容放在低地址处，把高位字节内容放在高地址处。

当然这个题目不是去调试看出这个机器的字节序。而是通过自己设计的程序的输出结果来判断。

#include <stdio.h>
int main()
{
	//大端在内存中的存储为00 00 00 01
	//小端在内存中的存储为01 00 00 00
	//我们就可以观察发现这个最低（高）位字节的内容是不同
	//那么我们就可以把这两个地方拿来比较
	int a = 1;
    //比较高位字节的内容
	if (*(char*)&a)//结果为1，就进入，输出就是小端
	{
		printf("是小端存储模式\n");
	}
	else
	{
		printf("是大端存储模式\n");
	}
	return 0;
}

#include <stdio.h>
int main()
{
	//大端在内存中的存储为00 00 00 01
	//小端在内存中的存储为01 00 00 00
	//我们就可以观察发现这个最低（高）位字节的内容是不同
	//那么我们就可以把这两个地方拿来比较
	int a = 1;
    //比较的是低位字节的内容
	if (*((char*)&a + 3))
	{
		printf("是大端存储模式\n");
	}
	else
	{
		printf("是小端存储模式\n");
	}
	return 0;
}

当然这个是要我们设计一个小程序，我们就可以写一个函数来判断。

#include <stdio.h>
int check_sys()//测试高位字节的内容
{
	int a = 1;
	return *(char*)&a;
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

关于char类型和short类型的取值范围

在写下面的题目之前，我们先来学习一下：signed char , unsigned char , int , unsigned int 这些常见的数据的范围。

还有一种是用数字轮的方式来表示范围。

根据上面这些我们就可以求出unsigned short的范围和signed short的范围了。

unsigned short是：0~65535

signed short是：-32768~32767

练习：

#include <stdio.h>
int main()
{
	//char虽然C语言规定是不明确的，但是大部分的编译器是认定为signed char。
	char a = -1;//11111111
	//-1的原码：10000000000000000000000000000001
	//    反码：11111111111111111111111111111110
	//    补码：11111111111111111111111111111111
	//因为int是4个字节，而char是一个字节，所以在把-1储存到a中会发生截断，
	//从末尾开始数一个字节的内容（8个比特位）截断储存到a中即可。 
	signed char b = -1;//与上面的一样11111111
	unsigned char c = -1;//与上面的一样11111111
	//当它们以%d的形式打印时，要发生整形提升。
	//整形提升的规则：是一个有符号数的时候，高位补符号位，
	//是一个无符号数的时候，高位是补0。
	printf("a=%d,b=%d,c=%d", a, b, c);
	//a和b是有符号的char，高位补符号位，11111111最高位是1，就补1。
	//很容易看出来就是-1，-1
	//c是无符号的char，高位补0，就是00000000000000000000000011111111——>255
	return 0;
}

#include <stdio.h>
int main()
{
	char a = -128;
	//-128的原码：10000000000000000000000010000000
	//      反码：11111111111111111111111101111111
	//      补码：11111111111111111111111110000000
	//截断之后a中存放的是10000000
	printf("%u\n", a);
	//%u是打印无符号整型，a会发生整形提升，因为是有符号的char，补符号位，最高位就是符号位，即补1
	//11111111111111111111111110000000——>整形提升后的结果，
	//%u是无符号打印就会把这个结果当成正数，就会直接输出这个结果（挺大的）
	return 0;
}

#include <stdio.h>
int main()
{
	char a = 128;
	//128的原码（补码）：00000000000000000000000010000000
	//截断之后a中存放的是10000000
	printf("%u\n", a);
	//%u是以无符号整型来打印的，首先得进行整形提升，因为是有符号的char，
	//把最高位看成符号位，最高位是1，就补1
	//11111111111111111111111110000000——>整形提升之后的结果
	//%u是无符号打印就会把这个结果当成正数，就会直接输出这个结果（挺大的）
	return 0;
}

#include <stdio.h>
int main()
{
	//有符号的char范围是-128~127
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		//在a中  -1表示为：11111111
		//在a中-128表示为：10000000，可以知道是在不断地减1，
		//-128减1就是：01111111——>这个结果就是127
		//-1 -2 ……-128 127……2 1 0（后面虽然还会有存储，但是我们不在关注了）
		//如果后面还继续存储的话，就是按照那个数字轮的顺序来的 
		//综上的结果：128+127==255
		a[i] = -1 - i;
	}
	//strlen关注的是字符串中是否有'\0'，我们就看这个a[i]中是否会出现0（'\0'的ASCII码值为0）
	printf("%d", strlen(a));
	return 0;
}

#include <stdio.h>
unsigned char i = 0;
//i是一个无符号的char，取值范围：0~255
int main()
{
	//我们会发现这个i的值不会超过255，即死循环打印
	for (i = 0; i <= 255; i++)
	{
		printf("hello world\n");
	}
	return 0;
}

#include <stdio.h>
int main()
{
	//i是一个无符号的int（总是大于等于0），32个比特位都是表示数值位
	//取值范围：0~4,294,967,295
	unsigned int i;
	for (i = 9; i >= 0; i--)//这个i>=0的表达式永远成立，那么同样是死循环打印
	{
		printf("%u\n", i);
	}
	return 0;
}

上面两个代码的效果，大家可以自己在编译器上实现一下。

#include <stdio.h>
int main()
{
	int a[4] = { 1, 2, 3, 4 };
	int* ptr1 = (int*)(&a + 1);
	int* ptr2 = (int*)((int)a + 1);
	printf("%x,%x", ptr1[-1], *ptr2);
	return 0;
}

这个代码在VS2022上的X86环境运行的，而X64的运行会没有结果产生。

浮点数在内存中的存储

常见的浮点数：3.14159、1E10等，浮点数家族包括： float、double、long double 类型。浮点数表示的范围：在float.h 中定义了。而整形家族类型的表示范围在 limits.h 中定义了。

浮点数在计算机内部的表示方法。根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式： V = (−1) ^ S * M ∗ 2 ^ E 。

• (−1) ^ S 表示符号位，当S=0，V为正数；当S=1，V为负数。

• M 表示有效数字，M是大于等于1，小于2的。

• 2 ^ E 表示指数位。

举例来说：十进制的5.0，写成二进制是 101.0 ，相当于 1.01×2^2 。那么，按照上面V的格式，可以得出S=0，M=1.01，E=2。十进制的-5.0，写成二进制是 -101.0 ，相当于 -1.01×2^2 。那么，S=1，M=1.01，E=2。

IEEE 754规定：对于32位的浮点数，最高的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M ；对于64位的浮点数，最高的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M。

浮点数存的过程

IEEE 754 对有效数字M和指数E，还有一些特别规定。前面说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表示小数部分。 IEEE 754 规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的 xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字，精确程度更高。至于指数E，情况就比较复杂：首先，E为一个无符号整数，这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。比如，2^10的E是 10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

浮点数取的过程

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。比如：0.5 的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表示为01111110，而尾数1.0去掉整数部分1为0，补齐0到23位 00000000000000000000000，则其二进制表示形式为：

0 01111110 00000000000000000000000

E全为0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。因为指数E是负数，就表示一个很小的数，再乘上一个小数，变得更加小了。

E全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）因为E全为1之后，是255，即使减去127，也是一个非常大的指数，至于那个有效数字的大小已经不会影响到整个数值了。

练习

#include <stdio.h>
int main()
{
	int n = 9;
	//9是以00000000000000000000000000001001这种方式存放在内存中的
	float* pFloat = (float*)&n;
	//n本身是一个整形，按照整形打印就是其本身
	printf("n的值为：%d\n", n);
	//如果按照浮点数的方式打印的话，就得先把这个数按照浮点数的方式取出来，
	//00000000000000000000000000001001会被按照浮点数的方式给取出来
	//0 100000000 00000000000000000001001，我们会发现这个E是全0，也就意味着
	//真实的E是一个1-127，那么这就是一个无限接近0的正数，那么float在打印时就是0
	printf("*pFloat的值为：%f\n", *pFloat);
	*pFloat = 9.0;
	//1001.0  1.001*2^3  S=0,M=1.001,E=3
	//现在在内存中存放的内容是0 10000010(130) 0010000000000000000000
	//%d是以整数的形式打印，9.0在内存中的补码是
	//0100000100010000000000000000000，最高位是0，即原码也是这个，就直接打印   
	printf("num的值为：%d\n", n);
	//n现在指向的内容已经被改成了浮点数，打印就是本身
	printf("*pFloat的值为：%f\n", *pFloat);
	return 0;
}

运行环境VS2022 X86