数据在内存中的存储

个人主页(找往期文章包括但不限于本期文章中不懂的知识点): 我要学编程(ಥ_ಥ)-CSDN博客

目录

整数在内存中的存储

大小端字节序和字节序判断

大小端的概念

为什么有大小端

百度笔试题

关于char类型和short类型的取值范围 

练习: 

浮点数在内存中的存储

浮点数存的过程 

浮点数取的过程

练习


整数在内存中的存储

在学习操作符的时候,我们就学习了整数的2进制表示方法,有三种 原码、反码和补码 三种表示方法,均有符号位和数值位两部分组成,符号位都是用0表示 正,用1表示 负 ,而最高位的一位是被当做符号位,剩余的都是数值位。 正整数的原、反、补码都相同。 负整数的三种表示方法各不相同。

原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。

反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码:反码+1就得到补码。

直到其一可以求出另外两个。具体方法都在操作符详解(上)-CSDN博客 中

对于整形来说:数据存放内存中其实存放的是补码。 为什么呢? 在计算机系统中,数值一律用补码来表示和存储。 原因在于,使用补码,可以将符号位和数值位统⼀处理; 同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

大小端字节序和字节序判断

大小端的概念

其实超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下面是具体的概念:

大端存储模式:是指数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处。
小端存储模式:是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处。 上述概念需要记住,方便分辨大小端。

为什么有大小端

为什么会有大小端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit位,但是在C语言中除了8 bit的char 之外,还有16 bit的 short 型,32 bit的long 型(要看具体的编译器,因为C语言只是规定了long大于等于int),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。 例如:一个 16bit 的 short型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在⾼地址中,即 0x0011 中。小端模式,刚好相反。我们常用的VS X86结构是小端模式,而KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

接下来,我们就可以看看自己的电脑是大端还是小端存储模式。

那个变量a的高字节内容是11,低字节内容是44,这个是根据二进制位翻译而来,

0001   0001    0010    0010    0011    0011    0100    0100 ,而后面44就是低权重位,也就是低字节内容了。

总结:低字节内容放在低地址处,高字节内容放在高地址处,这就意味着是小端存储。 

百度笔试题

请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)

字节序:以字节为单位,讨论储存顺序。

大端字节序:数据在存储的时候,把高位字节内容放在低地址处,把低位字节内容放在高地址处。

小端字节序:数据在存储的时候,把低位字节内容放在低地址处,把高位字节内容放在高地址处。

当然这个题目不是去调试看出这个机器的字节序。而是通过自己设计的程序的输出结果来判断。

#include <stdio.h>
int main()
{
	//大端在内存中的存储为00 00 00 01
	//小端在内存中的存储为01 00 00 00
	//我们就可以观察发现这个最低(高)位字节的内容是不同
	//那么我们就可以把这两个地方拿来比较
	int a = 1;
    //比较高位字节的内容
	if (*(char*)&a)//结果为1,就进入,输出就是小端
	{
		printf("是小端存储模式\n");
	}
	else
	{
		printf("是大端存储模式\n");
	}
	return 0;
}

#include <stdio.h>
int main()
{
	//大端在内存中的存储为00 00 00 01
	//小端在内存中的存储为01 00 00 00
	//我们就可以观察发现这个最低(高)位字节的内容是不同
	//那么我们就可以把这两个地方拿来比较
	int a = 1;
    //比较的是低位字节的内容
	if (*((char*)&a + 3))
	{
		printf("是大端存储模式\n");
	}
	else
	{
		printf("是小端存储模式\n");
	}
	return 0;
}

当然这个是要我们设计一个小程序,我们就可以写一个函数来判断。

#include <stdio.h>
int check_sys()//测试高位字节的内容
{
	int a = 1;
	return *(char*)&a;
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

关于char类型和short类型的取值范围 

在写下面的题目之前,我们先来学习一下:signed char , unsigned char , int , unsigned int 这些常见的数据的范围。 

还有一种是用数字轮的方式来表示范围。

根据上面这些我们就可以求出unsigned short的范围和signed short的范围了。

unsigned short是:0~65535

signed short是:-32768~32767 

练习: 

#include <stdio.h>
int main()
{
	//char虽然C语言规定是不明确的,但是大部分的编译器是认定为signed char。
	char a = -1;//11111111
	//-1的原码:10000000000000000000000000000001
	//    反码:11111111111111111111111111111110
	//    补码:11111111111111111111111111111111
	//因为int是4个字节,而char是一个字节,所以在把-1储存到a中会发生截断,
	//从末尾开始数一个字节的内容(8个比特位)截断储存到a中即可。 
	signed char b = -1;//与上面的一样11111111
	unsigned char c = -1;//与上面的一样11111111
	//当它们以%d的形式打印时,要发生整形提升。
	//整形提升的规则:是一个有符号数的时候,高位补符号位,
	//是一个无符号数的时候,高位是补0。
	printf("a=%d,b=%d,c=%d", a, b, c);
	//a和b是有符号的char,高位补符号位,11111111最高位是1,就补1。
	//很容易看出来就是-1,-1
	//c是无符号的char,高位补0,就是00000000000000000000000011111111——>255
	return 0;
}

#include <stdio.h>
int main()
{
	char a = -128;
	//-128的原码:10000000000000000000000010000000
	//      反码:11111111111111111111111101111111
	//      补码:11111111111111111111111110000000
	//截断之后a中存放的是10000000
	printf("%u\n", a);
	//%u是打印无符号整型,a会发生整形提升,因为是有符号的char,补符号位,最高位就是符号位,即补1
	//11111111111111111111111110000000——>整形提升后的结果,
	//%u是无符号打印就会把这个结果当成正数,就会直接输出这个结果(挺大的)
	return 0;
}

#include <stdio.h>
int main()
{
	char a = 128;
	//128的原码(补码):00000000000000000000000010000000
	//截断之后a中存放的是10000000
	printf("%u\n", a);
	//%u是以无符号整型来打印的,首先得进行整形提升,因为是有符号的char,
	//把最高位看成符号位,最高位是1,就补1
	//11111111111111111111111110000000——>整形提升之后的结果
	//%u是无符号打印就会把这个结果当成正数,就会直接输出这个结果(挺大的)
	return 0;
}

#include <stdio.h>
int main()
{
	//有符号的char范围是-128~127
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		//在a中  -1表示为:11111111
		//在a中-128表示为:10000000,可以知道是在不断地减1,
		//-128减1就是:01111111——>这个结果就是127
		//-1 -2 ……-128 127……2 1 0(后面虽然还会有存储,但是我们不在关注了)
		//如果后面还继续存储的话,就是按照那个数字轮的顺序来的 
		//综上的结果:128+127==255
		a[i] = -1 - i;
	}
	//strlen关注的是字符串中是否有'\0',我们就看这个a[i]中是否会出现0('\0'的ASCII码值为0)
	printf("%d", strlen(a));
	return 0;
}

#include <stdio.h>
unsigned char i = 0;
//i是一个无符号的char,取值范围:0~255
int main()
{
	//我们会发现这个i的值不会超过255,即死循环打印
	for (i = 0; i <= 255; i++)
	{
		printf("hello world\n");
	}
	return 0;
}
#include <stdio.h>
int main()
{
	//i是一个无符号的int(总是大于等于0),32个比特位都是表示数值位
	//取值范围:0~4,294,967,295
	unsigned int i;
	for (i = 9; i >= 0; i--)//这个i>=0的表达式永远成立,那么同样是死循环打印
	{
		printf("%u\n", i);
	}
	return 0;
}

上面两个代码的效果,大家可以自己在编译器上实现一下。 

#include <stdio.h>
int main()
{
	int a[4] = { 1, 2, 3, 4 };
	int* ptr1 = (int*)(&a + 1);
	int* ptr2 = (int*)((int)a + 1);
	printf("%x,%x", ptr1[-1], *ptr2);
	return 0;
}

这个代码在VS2022上的X86环境运行的,而X64的运行会没有结果产生。

浮点数在内存中的存储

常见的浮点数:3.14159、1E10等,浮点数家族包括: float、double、long double 类型。 浮点数表示的范围: 在float.h 中定义了。而整形家族类型的表示范围在 limits.h 中定义了。

浮点数在计算机内部的表示方法。 根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式: V   =  (−1) ^ S * M ∗ 2 ^ E 。

• (−1) ^ S 表示符号位,当S=0,V为正数;当S=1,V为负数。

• M 表示有效数字,M是大于等于1,小于2的。

• 2 ^ E 表示指数位。

举例来说: 十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。 十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。

IEEE 754规定: 对于32位的浮点数,最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M ;对于64位的浮点数,最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M。

浮点数存的过程 

IEEE 754 对有效数字M和指数E,还有一些特别规定。 前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。 IEEE 754 规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字,精确程度更高。至于指数E,情况就比较复杂:首先,E为一个无符号整数,这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是 10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

浮点数取的过程

指数E从内存中取出还可以再分成三种情况:

E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。 比如:0.5 的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表示为01111110,而尾数1.0去掉整数部分1为0,补齐0到23位 00000000000000000000000,则其二进制表示形式为:

0 01111110 00000000000000000000000

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。因为指数E是负数,就表示一个很小的数,再乘上一个小数,变得更加小了。

E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s) 因为E全为1之后,是255,即使减去127,也是一个非常大的指数,至于那个有效数字的大小已经不会影响到整个数值了。

练习

#include <stdio.h>
int main()
{
	int n = 9;
	//9是以00000000000000000000000000001001这种方式存放在内存中的
	float* pFloat = (float*)&n;
	//n本身是一个整形,按照整形打印就是其本身
	printf("n的值为:%d\n", n);
	//如果按照浮点数的方式打印的话,就得先把这个数按照浮点数的方式取出来,
	//00000000000000000000000000001001会被按照浮点数的方式给取出来
	//0 100000000 00000000000000000001001,我们会发现这个E是全0,也就意味着
	//真实的E是一个1-127,那么这就是一个无限接近0的正数,那么float在打印时就是0
	printf("*pFloat的值为:%f\n", *pFloat);
	*pFloat = 9.0;
	//1001.0  1.001*2^3  S=0,M=1.001,E=3
	//现在在内存中存放的内容是0 10000010(130) 0010000000000000000000
	//%d是以整数的形式打印,9.0在内存中的补码是
	//0100000100010000000000000000000,最高位是0,即原码也是这个,就直接打印   
	printf("num的值为:%d\n", n);
	//n现在指向的内容已经被改成了浮点数,打印就是本身
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

运行环境VS2022 X86 

好啦!本期数据在内存中的存储就学习完了!下一期再一起学习结构体吧 

评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我要学编程(ಥ_ಥ)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值