数据在内存中的存储
1. 整数在内存中的存储
整数的二进制表示方法有三种,即原码,反码,补码
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值为最高位的一位被当作符号位,剩余都是数值位
-
正数原反补相同
-
负数
- 原码:跟正数相同,仅符号位要取1
- 反码:原码符号位不变,其他位按位取反
- 补码:反码+1即补码
计算机内存中存放的整数都是补码的形式,有如下好处:
使用补码,可以将符号位和数值位统一处理
同时,加法减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路
2. 大小端字节序和字节序判断
了解了整数在内存中的存储后,观察如下代码
#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int main() {
int a = 0x11223344;
return 0;
}
经过调试可以发现,a的0x11223344
这个数字是按字节为单位,倒着存储的,这是为什么呢
这里就要讲到大小端的概念
其实超过一个字节的数据在内存中存储的时候,就会有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下面是具体的概念:
- 大端(存储)模式:指数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处
- 小端(存储)模式:指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处
为什么会有大小端之分呢?
这是因为在计算机系统中, 我们是以字节为单位的,每个地址单元都对应着一个字节, 一个字节为8bit位,但是在c语言中除了8bit的char
之外,还有16bit的short
型,32bit的long
型(要看具体的编译器),另外,对于大于8位的处理器,例如16位或32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题,因此就出现了大端存储模式和小端存储模式
例如:一个16bit
的short
型x
,在内存中的地址为0x0010
,x
的值为0x1122
,那么0x11
为高字节,0x22
为低字节。对于大端存储模式,就将0x11
放在低地址中,即0x0010
中,0x22
放在高地址中,即0x0011
中;小端模式则相反。我们常用的x86
结构是小端模式,而KEIL C51
则为大端模式。很多的ARM,DSP都为小端模式,有些ARM处理器还可以由硬件来选择是大端模式还是小端模式
设计一个小程序判断当前机器的字节序
//代码1
#include <stdio.h>
int check_sys()
{
int i = 1;
return (*(char *)&i);
}
int main()
{
int ret = check_sys();
if(ret == 1)
{
printf("⼩端\n");
}
else
{
printf("⼤端\n");
}
return 0;
}
//代码2(联合体将在后面的自定义类型中讲解)
int check_sys()
{
union
{
int i;
char c;
}un;
un.i = 1;
return un.c;
}
3. 浮点数在内存中的存储
常见的浮点数:3.14159,1E10等,浮点数家族包括:float,double,long double
类型
浮点数表示的范围:float.h
中定义
即便在内存中的数据完全相同,作为整数的解读和作为浮点数的解读,两者的结果也是天差地别,原因就在于浮点数在内存中的存储方式与整数有很大不同
根据国际标准IEEE(电气电子工程师学会)754,任意一个二进制浮点数V哭表示成下面的形式:
V = (-1)S*M*2E
- (-1)S表示符号位,当S=0,V为正数,当S=1,V为负数
- M表示有效数字,M是大于等于1,小于2的
- 2E表示指数位
举例来说:
十进制的5.0,写成二进制是101.0
相当于1.01×2^2
那么按照上面V的格式,可以得出S=0,M=1.01,E=2
十进制的-5.0,则是S=1,M=1.01,E=2
IEEE 754规定:
对于32位浮点数,最高的一位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M
对于64位浮点数,最高的一位存储符号位S,接着的11位存储指数E,剩下发52位存储有效数字M
一些特殊规定
对于M:前面说过,1<=M<2
也就是说,M可以写成1.xxxxx
的形式,其中xxxxx
表示小数部分
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被省去,等到读取的时候再把1加上去,这要就可以多存储一位有效数字
对于E:
首先E是一个无符号整数
但是按理来说科学计数法的指数是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个数是127,对于11位的E,这个数是1023,比如2^10的E是10,所以保存成32位浮点数时,必须保存成1237,即10001001
浮点数取出的过程:
指数E从内存中取出还可以再分三种情况:
E不全为0或不全为1
这时,E减去127得到真实值,再将有效数字M前加上第一位的1
E全为0
这时,E就等于1-127即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数,这样做是为了表示±0以及很小的数字
E全为1
如果有效数字M全为0,表示正负无穷(±取决于符号位S)