C语言-数据的存储

iuhiihi

已于 2023-07-24 18:19:27 修改

阅读量39

点赞数 1

分类专栏：概念理解文章标签： c语言开发语言

于 2023-07-24 18:17:04 首次发布

本文链接：https://blog.csdn.net/m0_74279423/article/details/130574665

版权

概念理解专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本篇文章内容是关于数据存储的知识。

类型的意义：

不同类型，不同内存（空间）大小。

类型，真正意义上指向的是内存（空间）。

类型基本归类

类型基本分为整型家族和浮点数家族。

整型家族

char（unsigned char、signed char）
short（ unsigned short [int] 、signed short [int] ）
int（unsigned int、signed int）
long（unsigned long[int] 、signed long[int]）

（字符在存储的时候是以ASCII码值的形式存储的，ASCII码是整数，因此，字符（char）类型归于整型家族。）

两种创建短整型的方式，加int和不加int没什么区别，只是书写形式的差异。（就和布尔类型一样）

创建长整型也和短整型一样，有两种书写形式。

一般情况下，对于short、int、long，创建的时候只写short/int/long，那么就默认创建的是signed形式，也就有符号整型。

对于char类型，如果创建的时候只是写char，那么它到底是unsigned（无符号）还是signed（有符号），取决于编译器。

（常见编译器上，创建的char默认为signed char。）

浮点数家族

float
double

构造类型（自定义类型）

数组类型
结构体类型（struct）
枚举类型（enum）
联合类型（union）

结构体、枚举、联合都是自己创建的类型。（比如学生、书）

数组类型：

为什么也叫构造类型呢？

举几个例子：

int arr1[4]

它的类型是：int [4]

名称是：arr1

int arr2[9]

它的类型是：int [9]

名称是：arr2

数组的（类型或者大小）一变，那么它的类型就会变。

所以数组也算自定义类型。

指针类型

int* p1；
char* p2；
float* p3；
void* p4；

void运用于指针是这样的：void* p；（p是指没有具体类型的指针。）

p是指针，没有给它规定具体类型。

空类型

void表示空类型（无类型）

通常运用于函数参数、函数返回类型、指针类型。

整型在内存中的存储

变量的创建是要在内存中开辟空间的；空间的大小是根据类型而决定的。

那么数据如何存储到内存中呢？

要了解存储，首先要了解原码、反码、补码。

原码、反码、补码

计算机中，整数有三种2进制表示方式，即原码、反码、补码。

三种表示方法均有符号位和数值位两部分，符号位都是用0表示正，用1表示负；而数值位正数的原反补都相同。

正数的原反补是相同的。

负（整）数的原反补都不相同，需要计算。

原码：

直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码：

将原码的符号位不变，其他位依次按位取反就可以得到反码。

补码：

反码+1就得到补码。

举两个例子：

理解原码、反码、补码后，再引入一个知识点：

对于整型来说，数据存放内存中，存放的其实是补码。

补码与原码相互转换，其运算过程可以是相同的：

原码取反加1得到补码

补码取反加1得到原码

大小端介绍

什么是大端小端？

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中。

小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

为什么有大端和小端？

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short 型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32 位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ，x 的值为 0x1122 ，那么 0x11 为高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即0x0010 中，0x22放在高地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而KEILC51 则大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式

还是小端模式。

具体实例：

（注：只要内存中数据存储超过一个字节，就会涉及到数据存储的先后，就会涉及到大小端问题）

（浮点数也会有大小端问题）

关于数据在内存中的提取

访问字节：

如何精准地访问a中的第一个字节呢？

首先，取a地址，再将其进行强制类型转换为char类型。这样经过强转的地址，就是第一个字节的地址。解引用操作，就可以访问a的第一个字节。

代码如下：

关于数据存储总结

无符号数，整型提升时，补0

有符号数，整型提升时，高位补原来的符号位。

%u：打印无符号数。无符号数，和正数一样，原码就是补码。

%d：打印有符号整数。

无符号数原反补不用算，和正数一样。

如果说char a=10；那么是先将整型a放入，再截断成char类型。（因为数字本来就是整型，最小整型都是int。原则上来说，char根本就不能放整型。）

关于整型存储的值的范围

以char类型为例：

根据图片，可以看出二进制数字完美地形成一个闭环。

其他数据类型取值范围：

数据类型	符号	字节数	取值范围（数字）	取值范围（科学计数法）
char	signed	1	-128~127	-2^7 ~ 2^7-1
char	unsigned	1	0~255	0 ~ 2^8-1
short	signed	2	-32768~32767	-2^15 ~2^15-1
short	unsigned	2	0~65535	0 ~ 2^16-1
int	signed	4	-2147483648~2147483647	-2^31 ~ 2^31-1
int	unsigned	4	0~4294967295	0 ~ 2^32-1
long	signed	4	-2147483648~2147483647	-2^31 ~ 2^31-1
long	unsigned	4	0~4294967295	0 ~ 2^32-1
long long	signed	8	-9223372036854775808~ 9223372036854775807	-2^63 ~ 263-1
long long	unsigned	8	0 ~ 18446744073709551615	0 ~ 2^64-1
float		4	1.17549 * 10 ^-38 ~ 3.40282 * 10 ^ 38（绝对值）
double		8	2.22507 * 10 ^ -308 ~ 1.79769 * 10 ^308（绝对值）
long double		12	2.22507 * 10 ^ -308 ~ 1.79769 * 10 ^308（绝对值）

我们发现，在unsigned（无符号）时值范围总是会减一。

原因是0这个值也会占用类型中存储的值的个数。（比如原本二进制的表达有2^16个，而实际可以表达的值最大只能是2^16-1）

关于所有signed类型：

需要明白的是，只要是有符号类型，那么就必须用最高的比特位来当做符号位。（比如char类型是1个字节，8个bit，那么这8个bit中，有1个符号位，7个数值位）

关于所有unsigned类型：

需要明白的是，只要是无符号类型，那么就没有符号位，也就只能是自然数了。

浮点型在内存中的存储

以下代码说明了整型和浮点数存储是有区别的：

int main()

{        
        int n = 9;

        float *pFloat = (float *)&n;//将9强转换成浮点数类型。

        printf("n的值为：%d\n",n);、//9

        printf("*pFloat的值为：%f\n",*pFloat);//0.000000



        *pFloat = 9.0;

        printf("num的值为：%d\n",n);//

        printf("*pFloat的值为：%f\n",*pFloat);//9.000000

        return 0;
}

得出结论：浮点数和整型的存储方式是不一样的。

整型不能以浮点数的形式从内存中提取出来出来。

同理，浮点数也不能以整型形式从内存中提取出来。

浮点数存储规则

根据国际标准IEEE（电气和电子工程协会） 754，任意一个二进制浮点数V可以表示成下面的形式：

(-1)^S * M * 2^E

(-1)^S表示符号位，当S=0，V为正数；当S=1，V为负数。

M表示有效数字，大于等于1，小于2。

2^E表示指数位。

754标准，定义了浮点数在计算机内部的表示方法。

因此，浮点数5.5转换为二进制的结果是101.1。

注意：浮点数没有原反补概念。

浮点数实际存储

对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

对于S的值：

S的值只有两种：0或1。

当S=0，V为正数；当S=1，V为负数。

对于M的值：

前面说过，1≤M<2，也就是说，M可以写成1.xxxxxx的形式，其中xxxxxx表示小数部分。

IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此1可被舍去（实际也是舍去了），只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

对于E的值：

（存储：）

首先，E为一个无符号整数（unsigned int）

这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。

但是，我们知道，科学计数法中的E是可以出现负数的（内存中却不需要负数）。

所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。

比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127=137，

即10001001。（加127或加1023的目的是为了将E修正成正数）

（取出：）

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1
E全为0
E全为1

E不全为0或不全为1

这时，浮点数就采用下面的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。

比如：0.5（1/2）的二进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为1.0*2^(-1)，其阶码为-1+127=126，表示为01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000000000000000000，则其二进制表示形式为:

0 01111110 00000000000000000000000

E全为0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第一位的1，而是还原为0.xxxxxx的小数。这样做是为了表示±0，以及接近于0的很小的数字。

E全为1

这时，如果有效数字M全为0，表示±无穷大（正负取决于符号位s）；

存5.5是这样的：

取5.5是这样的：

实际上，大多数浮点数在存储的时候，无法精确地保存。因为M在大多数情况下，表示的数值无法和实际完全相等。在存储的时候，会有微小的差别。

因为double类型的M是52位，float类型的M是23位，所以double的精度更高。

数据在存和取的时候，视角很重要。

iuhiihi

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
C语言-数据的存储

数组类型结构体类型（struct）枚举类型（enum）联合类型（union）结构体、枚举、联合都是自己创建的类型。（比如学生、书）为什么也叫构造类型呢？举几个例子：它的类型是：int [4]名称是：arr1它的类型是：int [9]名称是：arr2数组的（类型或者大小）一变，那么它的类型就会变。所以数组也算自定义类型。指针类型int* p1；char* p2；float* p3；void* p4；void运用于指针是这样的：void* p；
复制链接

扫一扫

专栏目录