提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
前言
使用c语言的时,当我们对于数据如何在系统中存储的理解并未到位,往往会导致出现一些“意想不到”的bug。因此正确而又详细地了解c语言数据的储存方式是十分重要的。
一、数据的类型与十进制输出的对应格式
1.基本的内置形式
名称 | 输出格式以及字节数 |
---|---|
char | (%c/%s)1 |
short | (%hd)2 |
int | (%d)4 |
long | (%ld)>=4(常为8) |
long long | (%lld)>=long(c99) |
float | (%f)4 |
double | (%lf)8 |
注:除char类型默认未规定是否为有符号类型外(vs默认为有符号),其余都默认为有符号形式
2.自定义类型(构造类型)
- 数组类型
- 结构体类型 struct
- 枚举类型 enum
- 联合体类型 union
3.指针类型
- void* xx
- int(其他整形类型)* xx
- 函数指针
- 数组指针
- 指针的指针
- …
二、整形数据的存储方式
1.部分常见的,不完全了解整形存储导致的“bug”
- 如下代码,第一反应可能会认为a+b与c打印出的数据应该都是300,但事实却并非如此,这就涉及到整形数据(<=int)在存储时会进行整形提升,与读取数据所进行的截断
实际上,a,b在二进制存储时都会发生整形提升,因为使用%d打印,所以系统会读取4个字节的空间,但由于c本身为unsigned char(0-255),在发生截断(只有效存储一个字节)后,剩下的值此时再进行整形提升,得到的结果即为44
00000000000000000000000011001000 - a
00000000000000000000000001100100 - b
00000000000000000000000100101100 -a+b//实际处理后得到的
00101100 - c
00000000000000000000000000101100 - c//实际存储的c
printf("%d %d", a + b, c);
// //300 44
2.关于整形数据的存储方式详解
1.整形提升(数据类型<=int时发生)
<=int类型的数据在系统中一般都会转化成int类型存储(即提升后的结果),这样做是为了便于数据的处理。
ps:寻常算术转化(>=int时发生)
如果存在不同类型的操作数(>=int),系统会自动将数据转化成更高优先度的数据类型,否则数据的处理将不会进行
三、浮点数类型的存储方式
在说存储方式之前,我们可以看看以下代码以及运行结果
似乎很奇怪?但实际上这关系到浮点数存储与一般整形存储方式的不同
1.国际标准设定
-
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
- (-1)^S * M * 2^E
- (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。
- M表示有效数字,大于等于1,小于2。
- 2^E表示指数位。
因此,在存储浮点数时,实际保存的值为S、M、E三个数字的二进制(在存储时都恒>=0)
关于标准对E和M的细节
-
前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。
规定***默认M第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分***。如保存1.01时,只保存01,读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。这样可以在更少的空间里得到更高的精度 -
关于E,首先,E为一个无符号整数(unsigned int)
而科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E(0-255),这个中间数是127;对于11位的E(0-2047),这个中间数是1023。 如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。这样可以确保存储的E为大于0的数 -
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即***认为其为真实值(因为已经足够小了)***,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。
E全为1
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);
2.float以及double的存储方式
对于64位浮点数
此时我们再对上题进行分析
float f = 9.0;
所以f=1001.0(2)
此时将它写成标准形式:(-1) ^ 0 * 1.001 *2^3
s = 0
e = 3
M = 1.001
e+127=10000010(2)
即存储数据为0 10000010 00100000000000000000000
计算机浅敲一下,确实与程序执行的一样呐!✧٩(ˊωˋ*)و✧
四、大小端的介绍与检测
1.介绍
-
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址 中;
-
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。
如图小段存储
2.如何检测大小端
在了解到整形提升与数据的截断知识后,我们可以得到考虑利用int存储一个数据,并用char类型来读取它,由此便可以了解到当前机器的存储方式,代码如下
#include <stdio.h>
int main()
{
int i = 0x1122344;
char *a = (char *)&i;
if(*a == 0x44)
printf("小端\n");
else
printf("大端\n");//此时读取0x11
return 0;
}
PS:为什么会有大小端之分
在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
结言
以上,就是有关整形、浮点数存储与大小端的相关分享,不知道有没有对您有些帮助呢?如果有帮助,客官赏个赞可否╮( ̄▽ ̄)╭
另外,倘若文中有不足或错误的地方,希望各位大佬们能热心地指出来,小白感激不尽!!