深度剖析数据在内存中的存储
1.数据类型详细介绍
前面我们已经学习了基本的内置类型:
char //字符数据类型
short //短整型
int //整形
long //长整型
long long //更长的整形
float //单精度浮点数
double //双精度浮点数
//C语言有没有字符串类型?
以及他们所占存储空间的大小。
类型的意义:
- 使用这个类型开辟内存空间的大小(大小决定了使用范围)。
- 如何看待内存空间的视角。(类型决定数据看待及存储在内存空间中的方式)
相同的数值,在不同数据类型下在内存空间中存储形式由数据类型决定
1.1 类型的基本归类:
整形家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
两种写法都正确
(unsigned) 无符号:八位二进制表示最高位不为符号位,无符号数最高位当作有效位不当作符号位,表示的范围也更大
(signed) 有符号:八位二进制表示最高位为符号位,1表示负,0表示正
如:11111111:最高位1为符号位,则(11111111)10=-127
最高位1为有效位,则(11111111)10=255
浮点数家族:
float
double
构造类型:
数组类型
结构体类型 struct
枚举类型 enum
联合类型 union
指针类型
int pi;
char pc;
float pf;
void pv;//无具体类型的的指针
空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。
⒉.整形在内存中的存储:原码、反码、补码
2.1 原码、反码、补码
计算机中的整数有三种2进制表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位
正数的原、反、补码都相同。
负整数的三种表示方法各不相同。
原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码
整数原反补码相同,负数反码符号位不变,其余各位按位取反(0变1,1变0)
补码
(二进制形式)反码最后一位(最低位)+1就得到补码。
示例:
对于整形来说:数据存放内存中其实存放的是数据的补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统
一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
我们看看在内存中的存储:
这里可以观察到十六进制0x0000000a和0xfffffff6在内存中以0a 00 00 00和f6 ff ff ff形式存储,我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。这是又为什么?
下面我们介绍数据在内存中的大小端字节序存储模式
2.2.大小端字节序介绍及判断
什么大端小端:大端字节序存储模式和小端字节序存储模式
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中。
示例:
为什么有大端和小端:
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
写一段代码判断当前机器是大端/小端存储:
//int check_sys() {
// int a = 1;
// char* p = (char*)&a;
// return *p;
//}
//代码1
int check_sys() {
int a = 1;
return *((char*)&a);
}
int main() {
int ret = check_sys();
if (ret == 1) {
printf("大端存储模式\n");
}
else {
printf("小端存储模式\n");
}
return 0;
}
//代码2
int check_sys()
{
union
{
int i;
char c;
}un;
un.i = 1;
return un.c;
}
变量a在内存中以补码形式存在:0x 00 00 08 01
大端存储00 00 00 01 4字节–>8比特位=8位二进制位=2位16进制位=1字节
小端存储01 00 00 00 4字节
在这里我们定义变量a,强制类型转换访问a的第一个字节的数据,如果p为0则为大端,p为1则为小端
前面我们学过指针能访问变量地址的字节大小由指针类型决定,如char能访问1字节数据,int能访问4字节数据
这里用char*访问a地址第一个字节的数据,对p解引用操作打印a地址上第一个字节的值
2.3几道小题目
1.
//输出什么?
#include <stdio.h>
int main()
{
//整型提升:当有符号数按符号位补充--负数补1,无符号位直接补0
char a= -1;
//原10000000 00000000 00000000 00000001
//反11111111 11111111 11111111 11111110
//补11111111 11111111 11111111 11111111 4字节
// char存放1字节,截断为11111111
//char类型a在以%d格式打印时发生整形提升,a补码为11111111,
//整型提升后为补码11111111111111111111111111111110,原码110000000 00000000 00000000 00000001,故a==-1
signed char b=-1;
unsigned char c=-1;
//原10000000 00000000 00000000 00000001,补11111111 11111111 11111111 11111111
//c存储1字节数据截断取补码低位的二进制位11111111
//无符号整型提升高位补0,原00000000 00000000 00000000 11111111,c==255
printf("a=%d,b=%d,c=%d",a,b,c);
return 0;
}
答案:-1 -1 255
下面程序输出什么?
2.
#include <stdio.h>
int main()
{
char a = -128;
//原10000000 00000000 00000000 10000000,补11111111 11111111 11111111 10000000截断取补码高位11111111
//11111111整形提升高位补1,整型提升后补码11111111 11111111 1111111 11111110
//整型提升后原码为100000000 00000000 00000000 00000001,打印的是提升后的原码二进制转换成十进制
printf("%u\n",a);
//当我们使用 %u 来做转换规范时, printf会获取4字节的数据,并认为其为无符号整数 。
return 0;
}
答案:4294967168
整型提升步骤:
1.首先写出原码,补码的二进制序列
2.对补码按数据类型截断,对截断后的二进制序列进行整型提升,得到的是整型提升后的补码
3.将整型提升后的补码转换成原码,最终打印结果的是整型提升后原码转换成十进制的结果
注意:%d打印有符号数十进制,若有符号数按%u格式打印成十进制,那么在打印是默认为其无符号整数,原符号位按有效位计算
3.
#include <stdio.h>
int main()
{
char a = 128;
//原00000000 00000000 00000000 10000000,补11111111 11111111 11111111 10000000截断取补码高位10000000
//10000000整型提升为补码00000000 00000000 00000000 10000000,
//整型提升后原码为011111111 11111111 11111111 01111111
printf("%u\n",a);
return 0;
}
答案:4294967168
4.
int main(){
int i= -20;
//原10000000 00000000 00000000 00010100,补11111111 11111111 11111111 11101100
unsigned int j = 10;
//原00000000 00000000 00000000 00001010
//补码相加得 11111111 11111111 11111111 11110110,原00000000 00000000 00000000 00001010
printf("%d\n", i+j);
//按照补码的形式进行运算,最后格式化成为有符号整数
return 0;
}
答案:-10
5.
unsigned int i;
for(i = 9; i >= 0; i--)
{
printf("%u\n",i);
sleep(100);//睡眠100毫秒,0.1秒
}
答案:9 8 7 6 5 4 3 2 1 0 死循环(-1往后不断递减,将负数符号位当作有效位计算–unsigned int只能表示无符号整数)
6.
int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}
答案:char[]类型数组只能存储-128~127之间的数字
-1~-128–>自-129开始到-1000会转换成0-127之间的数字,-129->128,-130->127…当遇到0时默认为字符串结尾,strlen停止统计字符数('\0’标记字符串结尾,ascii码值为0),共存储-128-127之间的数字
255
7.
#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\n");
}
return 0;
}
答案:255
signed char类型可表示的数据范围:(类似一个环)
unsigned char数据类型可表示的范围:
各种数据类型的范围:
4.浮点型在内存中的存储解析
常见的浮点数:
3.14159
1E10
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围:float.h中定义