【进阶】【c语言细说基础篇】 #1 数据在内存中的储存 (整形与浮点数与大小端篇）

本文链接：https://blog.csdn.net/m0_72575802/article/details/128590404

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、数据的类型与十进制输出的对应格式
二、整形数据的存储方式
三、浮点数类型的存储方式
四、大小端的介绍与检测
结言

前言

使用c语言的时，当我们对于数据如何在系统中存储的理解并未到位，往往会导致出现一些“意想不到”的bug。因此正确而又详细地了解c语言数据的储存方式是十分重要的。

一、数据的类型与十进制输出的对应格式

1.基本的内置形式

名称	输出格式以及字节数
char	(%c/%s)1
short	(%hd)2
int	(%d)4
long	(%ld)>=4(常为8）
long long	(%lld)>=long(c99)
float	(%f)4
double	(%lf)8

注：除char类型默认未规定是否为有符号类型外（vs默认为有符号），其余都默认为有符号形式

2.自定义类型（构造类型）

数组类型
结构体类型 struct
枚举类型 enum
联合体类型 union

3.指针类型

void* xx
int(其他整形类型）* xx
函数指针
数组指针
指针的指针
…

二、整形数据的存储方式

1.部分常见的,不完全了解整形存储导致的“bug”

如下代码，第一反应可能会认为a+b与c打印出的数据应该都是300，但事实却并非如此，这就涉及到整形数据（<=int）在存储时会进行整形提升,与读取数据所进行的截断

在这里插入图片描述
实际上，a,b在二进制存储时都会发生整形提升，因为使用%d打印，所以系统会读取4个字节的空间，但由于c本身为unsigned char（0-255），在发生截断（只有效存储一个字节）后，剩下的值此时再进行整形提升，得到的结果即为44

00000000000000000000000011001000 - a
00000000000000000000000001100100 - b
00000000000000000000000100101100 -a+b//实际处理后得到的
00101100 - c
00000000000000000000000000101100 - c//实际存储的c

printf("%d %d", a + b, c);
//	//300 44

2.关于整形数据的存储方式详解

1.整形提升（数据类型<=int时发生）

在这里插入图片描述
<=int类型的数据在系统中一般都会转化成int类型存储（即提升后的结果），这样做是为了便于数据的处理。

ps:寻常算术转化(>=int时发生)

如果存在不同类型的操作数（>=int），系统会自动将数据转化成更高优先度的数据类型，否则数据的处理将不会进行
在这里插入图片描述

三、浮点数类型的存储方式

在说存储方式之前，我们可以看看以下代码以及运行结果
在这里插入图片描述

似乎很奇怪？但实际上这关系到浮点数存储与一般整形存储方式的不同

1.国际标准设定

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：
- (-1)^S * M * 2^E
- (-1)^S表示符号位，当S=0，V为正数；当S=1，V为负数。
- M表示有效数字，大于等于1，小于2。
- 2^E表示指数位。
因此，在存储浮点数时，实际保存的值为S、M、E三个数字的二进制（在存储时都恒>=0）

关于标准对E和M的细节
前面说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中xxxxxx表示小数部分。
规定***默认M第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分***。如保存1.01时，只保存01，读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。这样可以在更少的空间里得到更高的精度
关于E，首先，E为一个无符号整数（unsigned int）
而科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E（0-255），这个中间数是127；对于11位的E（0-2047），这个中间数是1023。 如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。这样可以确保存储的E为大于0的数
E不全为0或不全为1
这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。
E全为0
这时，浮点数的指数E等于1-127（或者1-1023）即***认为其为真实值（因为已经足够小了）***，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。
E全为1
这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

2.float以及double的存储方式

在这里插入图片描述
对于64位浮点数

此时我们再对上题进行分析

float f = 9.0;
所以f=1001.0(2)
此时将它写成标准形式：(-1) ^ 0 * 1.001 *2^3
s = 0
e = 3
M = 1.001
e+127=10000010(2)
即存储数据为0 10000010 00100000000000000000000

计算机浅敲一下，确实与程序执行的一样呐！✧٩(ˊωˋ*)و✧ 在这里插入图片描述

四、大小端的介绍与检测

1.介绍

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

如图小段存储
在这里插入图片描述

2.如何检测大小端

在了解到整形提升与数据的截断知识后，我们可以得到考虑利用int存储一个数据，并用char类型来读取它，由此便可以了解到当前机器的存储方式，代码如下

#include <stdio.h>
int main()
{
    int i = 0x1122344;
    char *a = (char *)&i;
    if(*a == 0x44)
        printf("小端\n");
    else
        printf("大端\n");//此时读取0x11
    return 0;
}

PS:为什么会有大小端之分

在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。