数据在内存中的存储，大小端，浮点数

Hungry_11

已于 2024-05-21 17:14:53 修改

阅读量776

点赞数 10

分类专栏： C语言程序设计进阶文章标签： c语言

于 2024-04-28 18:12:04 首次发布

本文链接：https://blog.csdn.net/m0_74093370/article/details/138285300

版权

C语言程序设计进阶专栏收录该内容

6 篇文章 0 订阅

订阅专栏

数据在内存中的存储

原码反码补码

整数的2进制表示方法有三种，即原码、反码和补码。
对于有符号数来说：

三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位最高位的一位是被当做符号位，剩余的都是数值位。

在计算机中数据存放内存中其实存放的是补码。
原因：使用补码，可以将符号位和数值位统一处理，也就是说在计算中，**符号位也要参与计算。**同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。
计算机中没有减法器，但是减一个数，等于加一个负数，而二进制中，加一个负数等于加这个数的补码。

大小端字节序

大小端介绍

什么是大小端：
超过一个字节的数据在内存中存储的时候，就有存储顺序的问题，我们要怎样在内存中存放数据呢。按照乱序正序还是倒序呢？计算机只采取了两种方式，按照不同的存储顺序，我们分为大端字节序存储和小端字节序存储。

大端字节序：数据的低位存在高地址称为大端字节序存储。
小端字节序：数据的低位存在低地址称为小端字节序存储。

如图正在写博客的这台电脑就是小端存储。因为位于低位的01存放在了低地址0x003EFD34。

为什么会有大小端：
为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit位，但是在C语言中除了8bit的short 型，32bit的char 之外，还有16bit的long 型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如：一个16bit 的short 型x，在内存中的地址为0x0010 ，x的值为0x22 为低字节。对于大端模式，就将0x22 放在高地址中，即0x1122 ，那么0x11 放在低地址中，即0x0011 中。小端模式，刚好相反。我们常用的0x0010 中，X86 结构是小端模式，而KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

写一个程序判断大小端

思路： 创建一个整型变量，如果是小端存储，那么就在低地址处存的0x01否则就在高地址处存的0x01，然后取变量的地址，强转为char型指针，然后解引用，得到的如果是1那么就是小端存储，否则就是大端存储。

int check_sys()
{
	int i = 1;
	if (*((char*)&i) == 1)
	{
		return 1;//小端
	}
	else
	{
		return 0;//大端
	}
	int i = 1;
	return *((char*)&i);
}
int main()
{
	if (check_sys)
		printf("小端");
	else
		printf("大端");
	return 0;
}

可以把check_sys()函数简化一下，因为已经知道返回的是1或者0，那么就直接返回地址处的值就好。

int check_sys()
{
	int i = 1;
	return *((char*)&i);
}
int main()
{
	if (check_sys)
		printf("小端");
	else
		printf("大端");
	return 0;
}

浮点数在内存中的存储

常见的浮点数：3.14159、1E10等，1E10表示1.0*10^10(1.0 乘10的10次方)。
浮点数类型包括float、double、long double （long double 在C99之后定义的）
浮点数表示的范围：float.h中定义

浮点数的存储

根据国际标准IEEE（电气和电子工程协会）754，任意一个二进制浮点数V可以表示成下面的形式：

V = (-1) ^ S * M * 2 ^ E
(-1) ^ S表示符号位，当S=0，V为正数；当S=1，V为负数
M表示有效数字，M是大于等于1，小于2的
2^E表示指数位

举例来说：
对于数字5.0，对应二进制是101.0，相当于1.01*2^2。
按照上面V的格式，可以得出S=0，M=1.01，E=2。
十进制的-5.0，写成二进制是-101.0 ，相当于-1.01×2^2 。那么，S=1，M=1.01，E=2。

IEEE 754规定：对于32位的浮点数(float)，最高的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M。

对于64位的浮点数，最高的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M。

浮点数存的过程

IEEE 754对有效数字M和指数E，还有一些特别规定。
前面说过，1≤M<2 ，也就是说，M可以写成1.xxxxxx 的形式，其中xxxxxx表示小数部分。
IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

至于指数E，情况就比较复杂。首先，E为一个无符号整数（unsigned int）
这意味着，如果E为8位，它的取值范围为0 ~ 255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

但是会出现一种情况，浮点数加了127仍然是一个负数，比如原来是-130，此时加127仍然是-3，这怎么办呢？
其实并不会出现这种情况，因为浮点数也是有自己的精度的，当浮点数E要是达到-127还小的数字的时候，说明小数点后面有126位0，然后才是1，这是一个相当小的数，我们遇不到这样的数字。

我们以float = 5.5举例看在内存中的数据

首先S = 0，然后M是101.1，然后舍弃最前面的1，就是011，然后E就是2，2要加上127，所以就是129，对应二进制为1000 0001。整体就是0 1000 0001 01100000000000000000000
我们放在内存中看就是0100 0000 1011 0000 00000000 00000000
就是40 b0 00 00，然后我们是小端存储的机器，所以高位就放在高地址。

浮点数取的过程

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1
这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。
比如：0.5的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表示为01111110，而尾数1.0去掉整数部分为0，补齐0到23位
则其二进制表示形式为
0 01111110 00000000000000000000000

E全为0
这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。
比如说：内存中存的是0 00000000 00010000…
那么取出来就不在加上原来开头隐含的1了，而是直接就是0.0001 * 2^-126

E全为1
这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

几种浮点数情况分析

int main()
{
	int n = 9;
	float* pfloat = (float*)&n;
	printf("n的d值为%d\n", n);
	printf("n的f值为%f\n", n);
	printf("*pfloat的d值为：%d\n", *pfloat);
	printf("*pfloat的lld值为：%lld\n", *pfloat);
	printf("*pfloat的f值为：%f\n", *pfloat);
	*pfloat = 9.0;
	printf("n的d值为%d\n", n);
	printf("*pfloat的d值为%d\n", *pfloat);
	printf("n的f值为%f\n", n);
	printf("*pfloat的f值为：%f\n", *pfloat);
	return 0;
}

第一个： 输入整型n，以%d输出整型n，输出9，没什么问题
第二个： n在内存中是1001，如果是32位的话，就是0 00000000 00000000000000000001001，我们以%f形式输出，就认为存的是浮点数的格式，中间指数E全是0，所以最有输出的就是(-1) ^ 0 * 0.00…01001 * 2 ^ （-126），这是一个非常小的数字，而**%f只输出小数点后6位**，自然就是0.000000。
第三个： 我们以pfloat的形式去取内存中的值，相当于取的float类型，以%f形式输出时是双精度浮点型，在输出前会转成double类型，变为64位，但是我们以%d的形式输出就会取后32位输出。而后32位补的全是0，自然输出的就是0.
第四个： 为了验证第三个对不对，我们用lld输出一个64位的数，输出的是一个非常大的数，所以说明我们第三个猜想是对的。
第五个： 和第二个情况一样，唯一的区别就是第二个不会转为64位，但是第五个是pfloat作为参数传入printf，会先变为double类型。但是结果都是一样的，中间指数全为0。

当执行*pfloat = 9.0时，内存中按照浮点数存入9.0，就是0 1000 0010 00100000000000000000000
第六个： 我们以n的形式取内存中的值，就是传参给printf的是一个整型，和浮点型的区别就是看会不会转化位64位，n是整型，不会转化，就把内存中的数按照整型输出的方式进行输出。
第七个： 与第三个类似
第八个： 因为是以n的形式传入的，所以认为是整型，不会变为64位，但是%f要输出64位，所以就在前面补0 ，补了32位0，所以这个值很小，然后就是输出的0。
第九个： *pfloat传入，要进行转换，但是转换后不影响自身大小。所以就是9.000000

下面就是这次输出的结果：
在这里插入图片描述
总结上面需要注意的：浮点数存储就按照上面规则来，但是当我们输出的时候就要注意：

printf的输出格式，int 和 long int 都是32位的，用%d输出；float 、double都是%f输出，但 float 是32位的，double 是64位的，所以在参数传递的时候C语言统一将 float 类型数值传换为 double 类型再传入 printf 函数。如果是64位整型则输出格式为%lld。
我们的传入的参数类型影响传入的值，可能存在转换的情况，输出的类型（%d，%f等）影响输出的格式，输出只看参数传入后的值，然后修改调整，例如上面的第八个。

Hungry_11

关注

10
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
数据在内存中的存储，大小端，浮点数

超过一个字节的数据在内存中存储的时候，就有存储顺序的问题，我们要怎样在内存中存放数据呢。按照乱序正序还是倒序呢？计算机只采取了两种方式，按照不同的存储顺序，我们分为大端字节序存储和小端字节序存储。数据的低位存在高地址称为大端字节序存储。数据的低位存在低地址称为小端字节序存储。如图正在写博客的这台电脑就是小端存储。因为位于低位的01存放在了低地址0x003EFD34。为什么会有大小端模式之分呢？
复制链接

扫一扫