【C语言篇】——数据的存储

曲奇饼干~

已于 2022-03-06 00:35:15 修改

阅读量451

点赞数 3

文章标签： c语言开发语言 c++

于 2022-03-05 23:19:00 首次发布

本文链接：https://blog.csdn.net/wyp13290791767/article/details/123217164

版权

文章目录

1. 数据类型介绍

C语言中基本的数据类型及其所占空间的大小
在这里插入图片描述

基本类型的归类：

整形家族

char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]

浮点数家族：

float
double

构造类型：

这里是引用> 数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

指针类型

int pi;
char pc;
float pf;
void pv;

空类型：

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型。

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。

那接下来我们谈谈数据在所开辟内存中到底是如何存储的？

比如：

int a = 20;
char b = 20;

可以看出给a分配了四个字节的空间，给b分配了一个字节的空间，那计算机是如何给他们存储的呢？

下面我们来了解以下概念：

2.1 原码、反码、补码

计算机中的整数有三种表示方法，即原码、反码和补码。

三种表示方法均有符号位和数值位两部分，一个数转换为二进制数，对于有符号数（后面我们会讲有符号数和无符号数的区别）来说，其二进制位的最高位表示符号位，都是用0表示“正”，用1表示“负”，其余部分表示数值位。

原码
直接将二进制按照正负数的形式翻译成二进制就可以。
反码
将原码的符号位不变，其他位依次按位取反就可以得到了。
补码
反码+1就得到补码。

正数的原、反、补码都相同。

例如：

int a=5;
//a的原码
00000000 00000000 00000000 00000101
//a的反码
00000000 00000000 00000000 00000101
//a的补码
00000000 00000000 00000000 00000101

负整数的三种表示方法各不相同。
例如：

int a=-5
//b的原码
10000000 00000000 00000000 00000101
//b的反码（原码的符号位不变，其它位按位取反得到）
11111111 11111111 11111111 11111010
//b的补码（反码+1得到）
11111111 11111111 11111111 11111011

对于整形来说：数据存放内存中其实存放的是补码。
我们通过代码来看一下
在这里插入图片描述

我们来分析一下

i为正数，其原码，反码，补码相同
0000 0000 0000 0000 0000 0000 0110 0100
转换为16进制表示 00 00 00 64

j的原码 1000 0000 0000 0000 0000 0000 0110 0100
转换为16进制表示 80 00 00 64
j的反码 1111 1111 1111 1111 1111 1111 1001 1011
j的补码 1111 1111 1111 1111 1111 1111 1001 1100
转换为16进制表示 ff ff ff 9c

通过分析可以发下对于i和j分别存储的是补码。但是我们发现存储的顺序有点不对劲，这是又为什么？

2.2 大小端介绍

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址
中；
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地
址中。

为什么有大端和小端：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。
但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节排的问题。因此就导致了大端存储模式和小端存储模式。
例如：
一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。
对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高地址中，即 0x0011 中。
小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

小端存储模式像这样
在这里插入图片描述
如何判断当前机器是大端存储还是小端存储呢？

我们可以用一个简单的代码来判断一下

int main()
{
	int i = 128;
	//因为128是正数，所以原码 反码 补码相同，都为：
	//0000 0000 0000 0000 0000 0000 1000 0000
	//转换为16进制为：
	//00 00 00 80
	char* pi = (char*)&i;//&i是int*型的指针，一次访问四个字节
	//而我们要的是一次访问一个字节的char*型指针，所以强制转换一下
	*pi = 0;//char*型的指针一次只能访问一个字节
	
	//如果是小端存储，在内存中应该是80 00 00 00
	//*pi=0之后变为00 00 00 00

	//如果是大端存储，在内存中应该是00 00 00 80
	//*pi=0之后变为00 00 00 80
	if (i == 0)
		printf("小端");
	if (i == 128)
		printf("大端");
	return 0;
}

看一下输出的结果
在这里插入图片描述

3. 浮点型在内存中的存储

3.1浮点数存储的典型例子

给定下面一段代码，大家思考一下输出结果是什么

int main()
{
int n = 9;
float *pFloat = (float *)&n;
printf("n的值为：%d\n",n);
printf("*pFloat的值为：%f\n",*pFloat);
*pFloat = 9.0;
printf("num的值为：%d\n",n);
printf("*pFloat的值为：%f\n",*pFloat);
return 0;
}

下面来看打印结果：
在这里插入图片描述
咦~ 为什么结果会是这个样子呢？
um 和 *pFloat 在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？

首先我们要先弄清楚浮点数在内存中存储的规则再来分析这段代码

3.2 浮点数存储规则

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

(-1)^S * M * 2^E
(-1)^s表示符号位，当s=0，V为正数；当s=1，V为负数。
M表示有效数字，大于等于1，小于2。
2^E表示指数位。

符号 (sign) : s决定这数是负数 (s = 1) 还是正数 (s = 0)
尾数 (ignificand) : M是一个二进制小数
阶码 (exponent): E的作用是对浮点数加权，这个权重是2的E次幂(可能是负数)

举例来说：
十进制的5.5，写成二进制是 101.1 ，相当于(-1)^0 * 1.011 * 2^2。
那么，按照上面V的格式，可以得出s=0，M=1.011，E=2。

十进制的-5.5，写成二进制是 -101.1 ，相当于(-1)^1 * 1.011 * 2^2。
那么，s=1，M=1.01，E=2。

IEEE 754规定：
对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。
float类型的存储模式
在这里插入图片描述
对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

double类型的存储模式
在这里插入图片描述

IEEE 754对有效数字M和指数E，还有一些特别规定。

首先，为了便于区分，下面就将

E真实的值称为E(真)，存入内存中的值称为E(存)

M真实的值称为M(真)，存入内存中的值称为M(存)

先来说说M(真)

1≤M(真)<2 ，也就是说，M(真)可以写成 1.xxxxxx 的形式，其中xxxxxx表示小数部分。

但是计算机在存储的时候，因为M(真)最高位都是1，所以不妨将最高位舍去，只保留后面的小数位，这样小数位就能多存储一位，当M(真)为1.001的时候，存储的时候1要舍去，只保留001.将该值记作M(存)

再来说说指数E(存)

首先，E(存)为一个无符号整数（unsigned int）
取值范围为：
float类型： 00000000 ~ 11111111，即0 ~ 255
double类型：00000000000 ~ 11111111111，即0 ~ 2047

由于E(真)还会取到负数，所及就规定，存入内存时E(真)必须再加上一个中间数
对于float类型，这个中间数是127。即E(存) = E(真)+127
对于double类型，这个中间数是1023。即E(存) = E(真)+1023

例如要存储1.01*2^10(float类型)
E(真)为10，E(存) = E(真)+127 = 137

3.2.1 浮点型数据存储的例子

在这里插入图片描述
我们可以调试一下看看

发现和预测的一样，而且是小端存贮

3.3 如何从内存中读取

有三种情况

E(存)不全为0或不全为1

这时，浮点数就采用下面的规则表示，即E(存)减去127（或1023），得到真实值，再将M(存)前加上第一位的1。

E(存)全为0

这时，浮点数的指数E(真)等于1-127（或者1-1023）即为真实值，
有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于
0的很小的数字。

E(存)全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

对上文浮点数存储典型例子的解释

在这里插入图片描述

根据前面所学内容，我们就能够来具体分析一下这道题目了

int main()
{
	int n = 9;
	float* pFloat = (float*)&n;//强制转换将int*型指针转换为float*型指针
	printf("n的值为：%d\n", n); //打印值为9，这个没有什么问题

	printf("*pFloat的值为：%f\n", *pFloat);//打印的为0.000000，为什么呢？
	//首先，pFloat是指向float类型数据的指针，通过对pFloat解引用计算机会认为这是个float类型数据
	// 所以读取的时候就会以浮点数类型的读取方式来读取
	//我们再来分析
	//首先9的补码为
	//0000 0000 0000 0000 0000 0000 0000 1001

	//0 00000000 000000000000000001001
	//S = 0
	//E(真) = 0-127 = -127
	//M(真) = 0.000000000000000009
	//打印出的值应该为(-1)^0*0.000000000000000009*2^-127(可以看出该值非常非常小，趋近于0)
	//由于float默认打印小数点后6位，后面的位数会忽略掉，所以就打印了0.000000

	*pFloat = 9.0;
	//通过解引用将n转变为float类型，这是就会以浮点数的存储规则来存储

	//解引用之后是这样存储的
	//9.0
	//1001.0
	//(-1)^0*1.001*2^2
	//S = 0
	//E(真) = 2+127 = 129
	//M(真) = 10010000000000000000000
	//即为0 10000001 10010000000000000000000

	//符号位是0，表示正数，正数的原码反码补码相同
	printf("num的值为：%d\n", n);
	//按照整形来打印
	//会打印出01000000110010000000000000000000所对应的十进制数
	
	printf("*pFloat的值为：%f\n", *pFloat);
	//按照浮点型来打印，这个没什么问题，毕竟存储的时候就是按照浮点数类型来存储的
	return 0;
}

以上就是今天所讲的内容，希望可以帮助大家去学习，博主能力有限，如果有什么错误的地方，欢迎各路大佬来指出

曲奇饼干~

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【C语言篇】——数据的存储

文章目录1. 数据类型介绍基本类型的归类：2. 整形在内存中的存储2.1 原码、反码、补码2.2 大小端介绍3. 浮点型在内存中的存储3.1浮点数存储的典型例子3.2 浮点数存储规则3.2.1 浮点型数据存储的例子3.3 如何从内存中读取对上文浮点数存储典型例子的解释1. 数据类型介绍C语言中基本的数据类型及其所占空间的大小基本类型的归类：整形家族charunsigned charsigned charshortunsigned short [int]signed short [i
复制链接

扫一扫