C语言进阶——数据在内存的存储

最新推荐文章于 2024-07-20 16:10:44 发布

赫洋同学

最新推荐文章于 2024-07-20 16:10:44 发布

阅读量102

点赞数

文章标签： c语言

本文链接：https://blog.csdn.net/qq_66103518/article/details/128548372

版权

一.数据类型的介绍

char //字符数据类型
short //短整型
int //整形
long //长整型
longlong //更长的整形
float //单精度浮点数
double //双精度浮点数

1.基本分类

（1）整型家族

char

        unsigned char

        signed char

short

        unsigned short [int]

        signed short [int]

int

        unsigned int

        signed int

long

        unsigned long [int]

        signed long [int]

char为什么也能归到整形家族？

因为char类型在内存中存的是ASCLL码值，是整形。所以划分为整形家族。

对于 unsigned 和 signed 就是无符号数跟有符号数

（2）浮点型家族

float
double

（3）构造类型

数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

（4）指针类型

int *pi;
char *pc;
float* pf;
void* pv;

（5）空类型

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型。

二.整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。

1.原码，反码，补码

计算机中的整数有三种2进制表示方法，即原码、反码和补码。

三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”

而数值位正数的原、反、补码都相同，负整数的三种表示方法各不相同

原码

直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码

将原码的符号位不变，其他位依次按位取反就可以得到反码。

补码

反码 + 1就得到补码

对于整形来说：数据存放内存是补码。

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

int a = 4;
//00000000 00000000 00000000 00000100 原码
//00000000 00000000 00000000 00000100 反码
//00000000 00000000 00000000 00000100 补码
//0x00 00 00 04 十六进制
int b = -4；
//10000000 00000000 00000000 00000100 原码
//11111111 11111111 11111111 11111011 反码
//11111111 11111111 11111111 11111100 补码
//0xff ff ff fc 十六进制

这里ab存储的是补码，计算的时候也需要用补码，而且是倒着的，这就是涉及到大小端

2.大小端

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

显然第三种乱序，我们使用数据的时候不能是原来的数据，所以我们采用前面的两种顺序

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；

大端【字节序】储存：

假设内存中有这样一个值是这样在内存中存储的：

小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

小端【字节序】储存：

假设内存中有这样一个值是这样在内存中存储的：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中，0x22 放在高地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

写一个代码来验证是大端还是小端，我们用数字1来验证

所以我们就拿出第一个字节 1——小端 0——大端

int main()
{
	int a = 1;
	char* p =(char*) &a;//int*
	if (*p == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
 
	}
	return 0;
}

还能再简化一下

int check_sys()
{
	int a = 1;
	char* p = (char*)&a;
	/*if (1 == *p)
		return 1;
	else
		return 0;*/
	/*return *p;*/
	return *(char*)&a;
}
 
int main()
{
	int ret = check_sys();//返回1是小端，返回0是大端
	if (1 == ret)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

3.小练习

先复习几个概念

无符号数整型提升是高位补0

有符号数整型提升是高位补符号位

char 是八个字节，所以有的时候要进行阶段，再次计算或者打印的时候进行整型提升

char的范围 - 128~127

00000000 0

00000001 1

...

10000000 - 128

10000001 - 127

...

11111111 - 1

unsigned char的范围0~255

% d打印是有符号整型

% u打印是无符号整型

整型提升是看数的类型，不是看你打印，看好数的类型进行补位，打印的时候再次看是否是有类型的数

因为无符号，就没有前面的符号位了，我们看练习再来分析

（1）打印结果 -1 -1 255

#include <stdio.h>

int main()
{
	char a = -1;
	-1 是整数，32bit
		10000000000000000000000000000001
		11111111111111111111111111111110
		11111111111111111111111111111111
		11111111 - a  截断，char只8个字节的大小，所以截断
		11111111111111111111111111111111 - 提升
		提升后是补码，打印是 % d，所以有符号，变为原码进行打印，signed char是一样的道理
		signed char b = -1;
	    unsigned char c = -1;
	    10000000000000000000000000000001
		11111111111111111111111111111110
		11111111111111111111111111111111
		11111111 - c 截断
		00000000000000000000000011111111
		因为是打印 % u，所以是无符号打印，补0，然后换位原码打印，是255
		- 1 - 1   255
		printf("a=%d,b=%d,c=%d", a, b, c);
	return 0;
}

（2）打印结果是 4294967168

#include <stdio.h>
int main()
{
	    char a = -128;
	    10000000000000000000000010000000
		11111111111111111111111101111111
		11111111111111111111111110000000 - 128的补码
		10000000 - a 截断 整型提升有符号数补符号位
        （因为a是char a，是有符号数，所以补符号位，跟你是 % d还是 % u打印没关系）
		11111111111111111111111110000000
		a是char类型的所以是有符号数，补符号位，得出补码，打印是 % u，无符号，所以直接打印补码
		4294967168
		printf("%u\n", a);

	return 0;
}

（3）打印结果是 4294967168

#include <stdio.h>
int main()
{
	    char a = 128;
	    00000000000000000000000010000000
		10000000 - a 截断 a是有符号数进行补位符号位
		11111111111111111111111110000000
		依旧打印无符号数，补码直接打印，很上面一样
		printf("%u\n", a);
	return 0;
}

（4）打印结果是-10

int main()
{
	int i = -20;
	unsigned int j = 10;
	    -20
		10000000000000000000000000010100
		11111111111111111111111111101011
		11111111111111111111111111101100
		10
		00000000000000000000000000001010
		结果
		11111111111111111111111111110110 - 补码
		补码变为原码
		11111111111111111111111111110101
		10000000000000000000000000001010
		- 10
	printf("%d\n", i + j);
	    i + j是无符号数，但是我打印是 % d有符号数打印，要变为原码
	return 0;
}

（5）这个死循环了，i是无符号数，所以i一直是正数，所以一直循环

unsigned int i;
for (i = 9; i >= 0; i--)
{
	printf("%u\n", i);
	Sleep(1000);
}

（6）打印结果是 255

int main()
{
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		a[i] = -1 - i;
	}
	往下走的时候，走到 - 128，char中的范围就是 - 128~127，所以数组里面就这么多
		128 + 127
		- 1 - 2 - 3 - 4 - 5 .. - 128 127 126 .... 5 4 3 2 1 0 - 1 - 2 ...
		printf("%d", strlen(a));
	//要找'\0' -- 也就是找到0

	return 0;
}

（7）这个也是死循环，因为unsigned char范围就是0~255，所以一直都在循环

#include <stdio.h>
unsigned char i = 0;//0~255

int main()
{
	for (i = 0; i <= 255; i++)
	{
		printf("hello world\n");
	}
	return 0;
}

三.浮点型在内存中的存储

1.常见的浮点数

3.14159
1E10
浮点数家族包括：float，double,long double 类型。
浮点数表示的范围： float.h 中定义

整型表示的范围：limits.h中定义

%f 或者 %lf 默认小数点为 6 位

2.浮点数的存储原则

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

(-1)^S * M * 2^E

(-1)^s表示符号位，当s=0，V为正数；当s=1，V为负数。

M表示有效数字，大于等于1，小于2。

2^E表示指数位。

举例来说：

十进制的5.0，写成二进制是 101.0 ，相当于 1.01×2^2 。

那么，按照上面V的格式，可以得出s=0，M=1.01，E=2。

十进制的-5.0，写成二进制是 -101.0 ，相当于 -1.01×2^2 。那么，s=1，M=1.01，E=2。

再来看一个

5.5 = 101.1 = 1.011 * 2 ^ 2 = (-1) ^ 0 * 1.011 * 2 ^ 2

小数点移动的时候，这是二进制，所以是二的几次方，二进制小数位后的权重是二的负一次方负二次方往后

所以浮点数的存储就是存进去 S M E 就够了

IEEE 754规定：

对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

此外还有特殊的规定，为了提高我们浮点数的精度

前面说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中xxxxxx表示小数部分。

IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

对于存放E也有特殊的规定

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

比如：

0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为

1.0*2^(-1)，其阶码为-1+127=126，表示为 01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000000000000000000，则其二进制表示形式为:

0 01111110 00000000000000000000000

E全为0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于 0的很小的数字。

M = 2^(-127) 是一个很小的数字趋近于 0

E全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

同理这将是一个很大的数字

5.5去演示一下

101.1

(-1) ^ 0 * 1.011 * 2 ^ 2

s = 0

m = 1.011

e = 2

0 10000001 01100000000000000000000

第一个s正负 后面是e加127 后面是m小数点后的数加上补0

40 b0 00 00 内存显示的十六进制

拿出来的时候看e的情况

9.0演示一下

1001.0

(-1) ^ 0 * 1.001 * 2 ^ 3

s = 0

e = 3

m = 1.001

0 10000010 00100000000000000000000

转化为十六进制

0x41 10 00 00

3.14去演示一下

0.14

0.125

0.015

11.001....01010000010101010101010101010

无法精确的写出0.14

浮点数无法精确保持，因为m的位数有限，所以64位的精度更高，就是double比float精度高

3.浮点数举例

int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);
	*pFloat = 9.0;
	printf("num的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);
	return 0;
}

我们来看四个打印的值分别是什么

我们一个一个拿出来单独分析

    n = 9;   

    printf("n的值为：%d\n", n);
以整型存入内存，以整型拿出
	printf("*pFloat的值为：%f\n", *pFloat);
以整型存入内存，以浮点型拿出
	*pFloat = 9.0;

	printf("num的值为：%d\n", n);
以浮点型存入内存，以整型拿出
	printf("*pFloat的值为：%f\n", *pFloat);
以浮点型存入内存，以浮点型拿出

所以第一个打印和最后一个打印，就很简单的分析出来是9和9.000000

我们来分析中间

int main()
{
	int n = 9;
	00000000000000000000000000001001 - 9的补码
	float* pFloat = (float*)&n;

	printf("n的值为：%d\n", n);//9
	printf("*pFloat的值为：%f\n", *pFloat);//0.000000
	这个时候用浮点数拿出来的时候，要用浮点数的方法
		0 00000000 00000000000000000001001
		s     e               m
		e为全0，这时，浮点数的指数E等于1 - 127（或者1 - 1023）即为真实值
		有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。
		这样做是为了表示±0，以及接近于0的很小的数字。
		(-1) ^ 0 * 0.00000000000000000001001 * 2 ^ -126   这个数很小很小
		所以打印出来才是0.000000

	* pFloat = 9.0;
	    改为9.0后，浮点数放进去
		1001.0
		(-1) ^ 0 * 1.001 * 2 ^ 3
		s = 0
		e = 3
		m = 1.001
		01000001000100000000000000000000

	printf("*pFloat的值为：%f\n", *pFloat);//9.0
	printf("num的值为：%d\n", n);//1,091,567,616
	    浮点数放进去，整型拿出来，我们看放进去的时候就是上面的值
		所以上面的补码 01000001000100000000000000000000化为原码打印出来就是1091567616

		return 0;
}

三.总结

无论是整型还是浮点型，都要先看清楚数据的类型，以及对应的字节大小，是否需要截断，是否需要整型提升，注意有符号数和无符号数的提升不同，补位也不同，打印的时候看清楚打印的是有符号数还是无符号数，对于浮点数，看清楚存入的是浮点数还是整型，拿出的时候也看清楚是浮点数还是整型，学会浮点数存入数据和拿出数据的规则。