数据在内存中的存储

最新推荐文章于 2022-10-21 23:41:39 发布

LGelo

最新推荐文章于 2022-10-21 23:41:39 发布

阅读量2.9k

点赞数 6

文章标签： c语言

本文链接：https://blog.csdn.net/qq_64438318/article/details/123566295

版权

文章目录

前言
一、C语言中数据的基本类型？
二、数据在内存中的存储方式
- 1.整型
- 2.浮点型
三、大小端字节序
结尾

前言

本篇文章主要是讲解一些常见数据类型在内存中的存储方式。

一、C语言中有哪些类型的数据

char 字符类型
short 短整型
int 整型
long 长整型
long long 更长的整型
float 单精度浮点型
double 双精度浮点型

而整型又分为有符号类型和无符号类型：

unsigned （无符号类型）：当我们定义无符号型数据时，要使用unsigned来定义数据

例如：unsigned char 这时就算无符号的char类型数据

signed （有符号类型）：当不是无符号数据时，就算不使用signed来定义，也是默认为有符号的

例如：char 、signed char 都是定义的有符号数据

不同类型的数据在内存中占据的大小不同，使用的范围也就不同。

二、数据在内存中的存储方式

1.整型的存储方式

有符号数在内存中有三种二进制存储的方式，分别是原码、反码、补码。

例如，整型的10的二进制编码分别为：

1.原码：1010

将十进制的数字转换为二进制的数据就是这个数的原码，而在计算机当中，整型类型的数据占据了4个字节的空间，每个字节有8个bit位，也就是有32个二进制位的大小，所以在计算机中10的原码是：

00000000 00000000 00000000 00001010

在二进制的最左边是高位，右边为地位。

在有符号数当中，二进制的最高位代表着符号位，如果为负数，符号位为1，为正数，符号位为1。

如，-10的原码就为：

10000000 00000000 00000000 00001010

2.反码：

正数的反码就是其原码，负数的反码就是符号位不变，其他位按位取反

10的反码：

00000000 00000000 00000000 00001010

-10的反码

11111111 11111111 11111111 11110101

3.补码

正数的补码也是和原码相同，负数的补码就是反码加1

-10的补码

11111111 11111111 11111111 11110110

在计算机当中，有符号整数都是按照补码的方式存储的，然后也是按照补码来用的。

那么了解了这些有什么用呢？

下面我们来看一段代码：

int main()
{
	unsigned int i;
	for (i = 9; i >= 0; i--)
	{
		printf("%u\n", i);
	}
	return 0;
}

这个代码的结果会是什么呢？

它不会把数据的按照什么补码来读取，而是直接看做原码读取，就算你的最高位是1，它也是看成无符号的。当 i 等于0时，再 -- ，得到的会是-1的补码，也就是

11111111 11111111 11111111 11111111

而 i 又是一个无符号数，而且是按无符号数来打印，所以这时候的 i 一个就是2^32-1，肯定大于0，而且最后也会一直循环，所以会造成死循环。

2.浮点数的存储方式

浮点数和整数在内存中的存储方式虽然都是二进制存储，但差别还是很大的。

举例来说：

5.0的二进制为 101.0，相当于1.01*2^2.

那么它的s=0，M=1.01,E=2.

-5.0的二进制为-101.0，相当于1.01*2^2.

s=1,M=1.01,E=2.

32位的浮点数，最高位是符号位s，接着的8位是指数E,剩下的23位是有效数M.

64位的浮点数，最高位是符号位s，接着的11位是指数E,剩下的52位是有效数M.

关于有效数M和指数E还有一些特别的规定：

而M总是在1到2之间的数，所以在计算机内部保存M时，默认这个数的第一位总是1，因此可以舍去，只保留后面的小数部分，例如 1.01 只保留 0.1 ，等到读取的时候再把1加上去。

至于E,就比较复杂了。

首先，E是一个无符号整数，这就意味着E如果为8位的话，它的取值范围为0-255,11位的话其取值范围就是0-2047。而在科学计数法中，E是可以出现负数的，所以IEEE 754规定，存入内存的真实值必须加上一个中间数，对于8位的E,加上的是127，对于11位的E,加上的中间数是1023.

比如，2^10的E是10，那么保存为32位浮点数时，必须保存为10+127=137，即10001001。

然后，指数E从内存中取出时还可以分为三种情况：

E不全为0或不全为1时：

这时，E就会减去127得到真实值，然后再在有效数的前面加上第一位的1.

如：

0.5的二进制形式为0.1，科学计数法表示为：1.0*2^(-1)，其指数位E就表示为-1+127

为01111110，底数1.0去掉1，表示为0，补齐到23位，所以其二进制表示为：

0 01111110 00000000000000000000000

E全为0时：

这时候指数E就等于1-127（或者1-1023）即为真实值。

有效数M不在加上第一位的1，而是还原成0.xxxx的小树，这样是为了表示0或者解决0的很小的数。

如：

0 00000000 10000000000000000000000

这里E：1-127=-126，M=1.1,s=0,数就为（-1）^0 *(1.1)*2^(-126) 这里就是一个非常小的数，在计算机上打印出来的话就是0.

E全为1时：

这个时候，E代表的值就是255-127，然后即使当M全部为0时，这个数也是一个非常大的数，可以表示为正负无穷大，正负取决于符号位s。

三、大小端字节序

什么是大小端字节序：

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存当低地址中。

小端（存储）模式。是指数据的低位保存在内存的低地址中，而数据的高位，保存在内存当高地址中。

为什么会有大小端呢

在计算机中，我们以字节为单位，每个地址单元都对应着一个字节，一个字节为8bit。但在C语言中没出来8bit的char外，还有16bit的short，32bit的int，另外，对于位数大于8Wie的处理器，由于寄存器宽度大于一个字节，那么必然存在一个如何将多个字节安排的问题，因此就产生了大小端存储模式。

例如：一个short类型的x，x的值为0x11223344，那么在小端字节序存储模式下，它在内存中的存放方式为： 44 33 22 11

低地址 ----> 高地址

而在大端字节序中，其存储方式就会发生改变:
11 22 33 44

低地址---> 高地址

如何判断计算机是使用的大端存储模式还是小端存储模式呢？

用以下代码就可以实现：

int main()
{
	int a = 1;
	char* p = (char*)&a;
	if (*p == 1)
		cout << "这是小端";
	else
		cout << "这是大端";
	return 0;
}

为什么这样就可以判断大小端呢？让我们看一下小端在内存的存储形式

可以看到，a是整型，占了4个字节，如果我们把它强制类型转换为char，那么我们就可以取到它低地址的一个字节，然后a又为1，所以根据存储形式，它只能为 00 或者 01，然后我们就可以判断，强制转换后的值是否为1，如果为1，则是小端，否则就是大端了。

结尾

要想学好计算机，那么数据的存储方式这些是必须要了解的，当我们对这些原理了解清楚后，我们的水平才能够有更好的进步。

LGelo

关注

6
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫