个人主页(找往期文章包括但不限于本期文章中不懂的知识点): 我要学编程(ಥ_ಥ)-CSDN博客
目录
整数在内存中的存储
在学习操作符的时候,我们就学习了整数的2进制表示方法,有三种 原码、反码和补码 三种表示方法,均有符号位和数值位两部分组成,符号位都是用0表示 正,用1表示 负 ,而最高位的一位是被当做符号位,剩余的都是数值位。 正整数的原、反、补码都相同。 负整数的三种表示方法各不相同。
原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。
反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:反码+1就得到补码。
直到其一可以求出另外两个。具体方法都在操作符详解(上)-CSDN博客 中
对于整形来说:数据存放内存中其实存放的是补码。 为什么呢? 在计算机系统中,数值一律用补码来表示和存储。 原因在于,使用补码,可以将符号位和数值位统⼀处理; 同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
大小端字节序和字节序判断
大小端的概念
其实超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下面是具体的概念:
大端存储模式:是指数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处。
小端存储模式:是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处。 上述概念需要记住,方便分辨大小端。
为什么有大小端
为什么会有大小端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit位,但是在C语言中除了8 bit的char 之外,还有16 bit的 short 型,32 bit的long 型(要看具体的编译器,因为C语言只是规定了long大于等于int),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。 例如:一个 16bit 的 short型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在⾼地址中,即 0x0011 中。小端模式,刚好相反。我们常用的VS X86结构是小端模式,而KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
接下来,我们就可以看看自己的电脑是大端还是小端存储模式。
那个变量a的高字节内容是11,低字节内容是44,这个是根据二进制位翻译而来,
0001 0001 0010 0010 0011 0011 0100 0100 ,而后面44就是低权重位,也就是低字节内容了。
总结:低字节内容放在低地址处,高字节内容放在高地址处,这就意味着是小端存储。
百度笔试题
请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)
字节序:以字节为单位,讨论储存顺序。
大端字节序:数据在存储的时候,把高位字节内容放在低地址处,把低位字节内容放在高地址处。
小端字节序:数据在存储的时候,把低位字节内容放在低地址处,把高位字节内容放在高地址处。
当然这个题目不是去调试看出这个机器的字节序。而是通过自己设计的程序的输出结果来判断。
#include <stdio.h>
int main()
{
//大端在内存中的存储为00 00 00 01
//小端在内存中的存储为01 00 00 00
//我们就可以观察发现这个最低(高)位字节的内容是不同
//那么我们就可以把这两个地方拿来比较
int a = 1;
//比较高位字节的内容
if (*(char*)&a)//结果为1,就进入,输出就是小端
{
printf("是小端存储模式\n");
}
else
{
printf("是大端存储模式\n");
}
return 0;
}
#include <stdio.h>
int main()
{
//大端在内存中的存储为00 00 00 01
//小端在内存中的存储为01 00 00 00
//我们就可以观察发现这个最低(高)位字节的内容是不同
//那么我们就可以把这两个地方拿来比较
int a = 1;
//比较的是低位字节的内容
if (*((char*)&a + 3))
{
printf("是大端存储模式\n");
}
else
{
printf("是小端存储模式\n");
}
return 0;
}
当然这个是要我们设计一个小程序,我们就可以写一个函数来判断。
#include <stdio.h>
int check_sys()//测试高位字节的内容
{
int a = 1;
return *(char*)&a;
}
int main()
{
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
关于char类型和short类型的取值范围
在写下面的题目之前,我们先来学习一下:signed char , unsigned char , int , unsigned int 这些常见的数据的范围。
还有一种是用数字轮的方式来表示范围。
根据上面这些我们就可以求出unsigned short的范围和signed short的范围了。
unsigned short是:0~65535
signed short是:-32768~32767
练习:
#include <stdio.h>
int main()
{
//char虽然C语言规定是不明确的,但是大部分的编译器是认定为signed char。
char a = -1;//11111111
//-1的原码:10000000000000000000000000000001
// 反码:11111111111111111111111111111110
// 补码:11111111111111111111111111111111
//因为int是4个字节,而char是一个字节,所以在把-1储存到a中会发生截断,
//从末尾开始数一个字节的内容(8个比特位)截断储存到a中即可。
signed char b = -1;//与上面的一样11111111
unsigned char c = -1;//与上面的一样11111111
//当它们以%d的形式打印时,要发生整形提升。
//整形提升的规则:是一个有符号数的时候,高位补符号位,
//是一个无符号数的时候,高位是补0。
printf("a=%d,b=%d,c=%d", a, b, c);
//a和b是有符号的char,高位补符号位,11111111最高位是1,就补1。
//很容易看出来就是-1,-1
//c是无符号的char,高位补0,就是00000000000000000000000011111111——>255
return 0;
}
#include <stdio.h>
int main()
{
char a = -128;
//-128的原码:10000000000000000000000010000000
// 反码:11111111111111111111111101111111
// 补码:11111111111111111111111110000000
//截断之后a中存放的是10000000
printf("%u\n", a);
//%u是打印无符号整型,a会发生整形提升,因为是有符号的char,补符号位,最高位就是符号位,即补1
//11111111111111111111111110000000——>整形提升后的结果,
//%u是无符号打印就会把这个结果当成正数,就会直接输出这个结果(挺大的)
return 0;
}
#include <stdio.h>
int main()
{
char a = 128;
//128的原码(补码):00000000000000000000000010000000
//截断之后a中存放的是10000000
printf("%u\n", a);
//%u是以无符号整型来打印的,首先得进行整形提升,因为是有符号的char,
//把最高位看成符号位,最高位是1,就补1
//11111111111111111111111110000000——>整形提升之后的结果
//%u是无符号打印就会把这个结果当成正数,就会直接输出这个结果(挺大的)
return 0;
}
#include <stdio.h>
int main()
{
//有符号的char范围是-128~127
char a[1000];
int i;
for (i = 0; i < 1000; i++)
{
//在a中 -1表示为:11111111
//在a中-128表示为:10000000,可以知道是在不断地减1,
//-128减1就是:01111111——>这个结果就是127
//-1 -2 ……-128 127……2 1 0(后面虽然还会有存储,但是我们不在关注了)
//如果后面还继续存储的话,就是按照那个数字轮的顺序来的
//综上的结果:128+127==255
a[i] = -1 - i;
}
//strlen关注的是字符串中是否有'\0',我们就看这个a[i]中是否会出现0('\0'的ASCII码值为0)
printf("%d", strlen(a));
return 0;
}
#include <stdio.h>
unsigned char i = 0;
//i是一个无符号的char,取值范围:0~255
int main()
{
//我们会发现这个i的值不会超过255,即死循环打印
for (i = 0; i <= 255; i++)
{
printf("hello world\n");
}
return 0;
}
#include <stdio.h>
int main()
{
//i是一个无符号的int(总是大于等于0),32个比特位都是表示数值位
//取值范围:0~4,294,967,295
unsigned int i;
for (i = 9; i >= 0; i--)//这个i>=0的表达式永远成立,那么同样是死循环打印
{
printf("%u\n", i);
}
return 0;
}
上面两个代码的效果,大家可以自己在编译器上实现一下。
#include <stdio.h>
int main()
{
int a[4] = { 1, 2, 3, 4 };
int* ptr1 = (int*)(&a + 1);
int* ptr2 = (int*)((int)a + 1);
printf("%x,%x", ptr1[-1], *ptr2);
return 0;
}
这个代码在VS2022上的X86环境运行的,而X64的运行会没有结果产生。
浮点数在内存中的存储
常见的浮点数:3.14159、1E10等,浮点数家族包括: float、double、long double 类型。 浮点数表示的范围: 在float.h 中定义了。而整形家族类型的表示范围在 limits.h 中定义了。
浮点数在计算机内部的表示方法。 根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式: V = (−1) ^ S * M ∗ 2 ^ E 。
• (−1) ^ S 表示符号位,当S=0,V为正数;当S=1,V为负数。
• M 表示有效数字,M是大于等于1,小于2的。
• 2 ^ E 表示指数位。
举例来说: 十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。 十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。
IEEE 754规定: 对于32位的浮点数,最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M ;对于64位的浮点数,最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M。
浮点数存的过程
IEEE 754 对有效数字M和指数E,还有一些特别规定。 前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。 IEEE 754 规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字,精确程度更高。至于指数E,情况就比较复杂:首先,E为一个无符号整数,这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是 10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。
浮点数取的过程
指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。 比如:0.5 的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表示为01111110,而尾数1.0去掉整数部分1为0,补齐0到23位 00000000000000000000000,则其二进制表示形式为:
0 01111110 00000000000000000000000
E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。因为指数E是负数,就表示一个很小的数,再乘上一个小数,变得更加小了。
E全为1
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s) 因为E全为1之后,是255,即使减去127,也是一个非常大的指数,至于那个有效数字的大小已经不会影响到整个数值了。
练习
#include <stdio.h>
int main()
{
int n = 9;
//9是以00000000000000000000000000001001这种方式存放在内存中的
float* pFloat = (float*)&n;
//n本身是一个整形,按照整形打印就是其本身
printf("n的值为:%d\n", n);
//如果按照浮点数的方式打印的话,就得先把这个数按照浮点数的方式取出来,
//00000000000000000000000000001001会被按照浮点数的方式给取出来
//0 100000000 00000000000000000001001,我们会发现这个E是全0,也就意味着
//真实的E是一个1-127,那么这就是一个无限接近0的正数,那么float在打印时就是0
printf("*pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
//1001.0 1.001*2^3 S=0,M=1.001,E=3
//现在在内存中存放的内容是0 10000010(130) 0010000000000000000000
//%d是以整数的形式打印,9.0在内存中的补码是
//0100000100010000000000000000000,最高位是0,即原码也是这个,就直接打印
printf("num的值为:%d\n", n);
//n现在指向的内容已经被改成了浮点数,打印就是本身
printf("*pFloat的值为:%f\n", *pFloat);
return 0;
}
运行环境VS2022 X86
好啦!本期数据在内存中的存储就学习完了!下一期再一起学习结构体吧