数据的五脏六腑-C语言数据类型在内存中是如何存储的?

📌前言

本篇文章主要介绍整型和浮点型在内存中的存储结构。


1.数据类型介绍

🍒话不多说,直接上图!
在这里插入图片描述


2.整型在内存中的存储模式

整型int在内存中占四个字节,但我们在观察内存时,发现它的存储是颠倒的,那究竟是怎么一回事呢?


2.1原码、反码、补码的介绍

计算机中的整型有三种表示方法,也就是原码反码补码
无符号数的原码、反码、补码相同
三种表示方法具有符号位和数值位两部分,符号位都是用0表示"正"用1表示"负",而数值位三种表示方法各不相同。

🍰原码:直接将二进制按照正负数的形式翻译成二进制即可。
🍰反码:原码的符号位不变,其他位按位取反即可。
🍰补码:反码+1即可得到补码。
于整型而言内存中存储的都是补码。

cpu只有加法器,使用补码,可以将符号位和数值域统一处理;同时加法和减法也可以统一处理,补码和原码相互转换,运算过程相同,不需要额外的硬件电路。


2.2计算机大端小端存储模式

🔍大端存储:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
🔍小端存储:是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中;

🍒举个栗子

int a=20;
//二进制代码:00000000000000000000000000010100
//转换成十六进制:0x00 00 00 14

🍉:但是我们在内存中看到的是:

0x00B3FEC8      14 00 00 00  //低地址
地址            C8 C9 CA CB
0x00B3FECC      cc cc cc cc
地址            CC CD CE CF
0x00B3FED0       			//高地址

🍉:
计算机中这里就是低位保存在低地址处,也就是小端存储模式。
一个16进制数可以兑换为4个二进制数,则两个为一个字节。
32个二进制数就是4个字节,则16进制中,8个二进制数就是4个字节,则16进制中2个数就是一个字节。

🍒为什么有大端和小端

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8
bit的char之外,还有16 bit的short型,32
bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题,因此就导致了大端存储模式和小端存储模式。
例如:一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。我们常用的X86结构是小端模式,而KEILC51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。


2.3整型提升

整型提升是按照变量的数据类型的符号位来提升的(高位)

涉及到算术运算就会进行整型提升
📖例1

int main()
{
	char a = -128;//有符号位的,且为1.
	//10000000000000000000000010000000原码
	//11111111111111111111111101111111反码
	//11111111111111111111111110000000补码
	//1000000
	//11111111111111111111111110000000-整型提升,a是有符号的
	//但是打印的无符号数,无符号数的原反补相同
	printf("%u\n", a);//打印的是无符号数,打印出一个很大的数,%u打印无符号数
	return 0;
}

📖例2

int main()
{
	char a = -1;
	//补码11111111111111111111111111111111
	//实际上是11111111
	signed char b = -1;
	//11111111
	unsigned char c = -1;//255
	//11111111
	printf("a=%d,b=%d,c=%d", a, b, c);
	//%d打印的是整型,所以要整型提升
}

📖例3

int main()
{
	char c = 1;
	printf("%u\n", sizeof(c));//1
	printf("%u\n", sizeof(+c));//4,只要进行了算术运算就会发生整型提升
	printf("%u\n", sizeof(!c));//1
}

2.4char类型的范围

🔍有符号的char类型是-128127
🔍无符号的char类型是0255
在这里插入图片描述

在这里插入图片描述

📖例1

unsigned char i = 0;//0-255
int main()
{
	for (i = 0; i <= 255; i++)//255+1=0
	{
		printf("hello world\n");
	}
	return 0;
}

🔑:这个代码便是一个死循环,i无论怎么加始终都是在0-255之间的,所以陷入了死循环。

📖例2

int main()
{
	char a[1000];//范围是-128到127
	int i;
	for (i = 0; i < 1000; i++)
	{
		a[i] = -1 - i;
	}
	printf("%d", strlen(a));//要找到'\0'或者0也行;
	//
}

🔑:有符号char类型范围为-128~127,strlen函数遇到\0(或者0)后停止计数,所以strlen函数则计算从开始到数组a中第一次出现0的地方,那么此时停止打印。


3.浮点数在内存中的存储

要想弄懂浮点数的内存存储,我们理解一段代码即可。

int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为:%d\n", n);
	printf("pFloat的值为:%f\n", *pFloat);

	*pFloat = 9.0;
	printf("num的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

🔑:程序运行结果为:
在这里插入图片描述
结果为什么是这个呢?

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
🔑:(-1)^S * M * 2^E
🔑:(-1)^S表示符号位,当s=0,V为正数;当s=1,V为负数。
🔑:M表示有效数字,大于等于1,小于2。
🔑:2^E表示指数位。

🔑:举例而言:

十进制的5.0,写成二进制是101.0,相当于1.01×2^2。
那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。

🔑:IEEE 754规定:
对于32位的浮点数:最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
在这里插入图片描述
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
在这里插入图片描述
🔓:IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。

至于指数E,情况就比较复杂。 首先,E为一个无符号整数(unsigned
int)这意味着,如果E为8位,它的取值范围为0-255;如果E为11位,它的取值范围为0-2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE
754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

👉:注意是E无符号数,而且存入内存中,所以要加上中间值,即使E是正数也要加
🌽:E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。比如:0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0 补齐0到23位00000000000000000000000
则其二进制表示形式为:0 01111110 00000000000000000000000

🌽:E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

🌽:E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);

那么此时回到那道题目:

👉:printf("pFloat的值为:%f\n", *pFloat);

我们将0x00000009拆分,得到符号位S=0,后面8位的指数E=0000000,最后的M=000 0000 0000 0000 0000 1001
9->0000 0000 0000 0000 0000 0000 0000 1001
由于指数E全为0,则浮点数V就写成:
V=(-1)^0 × 0.00000000000000000001001×2^(-126) =1.001×2^(-146)
显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000

👉:printf("num的值为:%d\n", n);

首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。
9.0 -> 1001.0
⭐️(-1)^0
⭐️1.001
⭐️2^3
s=0, M=1.001,E=3+127=130
那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,即10000010
所以,写成二进制形式,应该是S+E+M,即0 10000010 001 0000 0000 0000 0000 0000
这个32位的二进制数,还原成十进制,正是1091567616。

本章完,感谢支持!
在这里插入图片描述

  • 17
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值