目录
整形在内存中的存储
想要深入的了解数据存储的相关知识,就必须要了解数据存储的方法。
1.原码、反码、补码
在计算机中数字有三种二进制表达方式,分别是原码、反码、补码。而整形在内存中是以补码的形式存放的。在有符号整形中,最高位表示符号位。符号位为1表示数字为负,0表示数字为正。
正数
原码、反码、补码均为自身的二进制序列
负数
原码 : 直接将数值按照正负数的形式翻译成二进制就可以得到原码。反码 :将原码的符号位不变,其他位依次按位取反就可以得到反码。补码 :反码+1 就得到补码。
在 VS2019中创建变量a和b进行演示。
看图须知: 在VS中数据是以字节为单位倒着存放的(为何倒着存放后文会具体讲解)。为了便于表示内存中的数据以十六进制的形式存放。由于一个字节等于八个比特位,一个16进制中的0~f十六个数字可以写作0000~1111(四个比特位)十六个二进制数字。所以两个十六进制的数字可以表示一个字节,而图中一行四个字节正好就对应一个整形。
a=10,a的地址中存放的是 0x00 00 00 0a由于原反补相同,可见a在内存中存放的地址是10
b=-20,b的地址中存放的是0xff ff ff ec由于内存中存放的是补码,为了方便得到原码,我们把它以二进制的形式写出来
b的补码:11111111 11111111 11111111 11101100
b的反码:11111111 11111111 11111111 11101011(补码减一)
b的原码:1000000 0000000 0000000 00010100(符号位不变,其他位按位取反)
由原码可以看出在b的内存中存放的是-20
2.为何在内存中存放补码
原因一:使用补码,可以将符号位和数值域统一处理,同时,由于电脑的CPU中只有加法器,通过补码也能实现加法和减法的统一处理。
依然用上文a=10,b=-20来举例
如果用原码进行计算:
a 的原码:00000000 00000000 00000000 00001010
b 的原码:10000000 00000000 00000000 00010100
相加结果:10000000 00000000 00000000 00011110
结果为-30,很显然得到了错误的答案
如果用补码进行计算:
a 的补码:00000000 00000000 00000000 00001010
b 的补码:11111111 11111111 11111111 11101100
相加结果:11111111 11111111 11111111 11110110
结果原码:10000000 00000000 00000000 00001010
结果为-10答案正确
如果 a=-10 b=20,用补码计算:
a 的补码: 11111111 11111111 11111111 11110110
b 的补码: 00000000 00000000 00000000 00010100
相加结果:1 00000000 00000000 00000000 00001010(补码,去掉最高位1之后等于原码)
由于多次的进位会使反码多出来一个最高位一,但是由于内存最多只能存放32个二进制数字,所以会发生截断,一就被省去了,结果就是原本为负的符号位被干掉,剩下的变为正数的补码,由于整数原反补相同,得到正确答案为10。
原因二:补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
原码到补码只有上文所描述的一种方法。
补码到原码有,原码减一再取反和取反再加一两种。(因之不需要额外电路)
3.大小端介绍
1).何为大小端
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位 , ,保存在内存的高地址中。
2).为什么有大端和小端
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit 。但是在 C 语言中除了 8 bit 的 char 之外,还有 16 bit 的 short型,32 bit 的 long 型(要看具体的编译器),另外,对于位数大于 8 位的处理器,例如 16 位或者 32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM , DSP 都为小端模式。有些 ARM 处理器还可以由硬件来选择是大端模式还是小端模式。
3).如何判断大小端
百度2015年系统工程师笔试题:
请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10 分)
只需要运用大小端的知识,编写一个函数,在函数中定义一个简单的变量i,假设i的值为1,1的十六进制位为0x00 00 00 01,如果是小端,则在内存中存放的方式为(低地址) 01 00 00 00(高地址),如果是大端就是和原来一样的(低地址)00 00 00 01(高地址)。把强制转换为char*,由于char*一次只能访问一个字节,并且从低地址向高地址访问。所以,小端被强制转换后内存中留下01,而大端留下00。(代码如下)
#include <stdio.h>
int check_sys()
{
int i = 1;
return (*(char *)&i);
}
int main()
{
int ret = check_sys();
if(ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0; }
4).在VS中由于小端存储而产生的死循环问题
如下程序,按照一般的思路应该会认为程序会由于数组的越界访问而报错,最终程序崩溃。但是,事实上程序会陷入死循环。
#include <stdio.h>
int main()
{
int i = 0;
int arr[10] = {0};
for(i=0; i<=12; i++)
{
arr[i] = 0;
printf("hehe\n");
}
return 0;
}
具体原因,由下图讲解:
而关于为何数组arr[10]和i之间间隔了两个整形的空间,这完全是由编译器自身决定的,不同的编译器变量之间的空位个数不同。(例:VC 6.0中没有间隔整形空间;gcc中间隔一个整形;VS2013\2019\2022都是间隔两个整形)
4.在char字符中存放整形
整形分为无符号整形和有符号整形。
在char中存放无符号整形时,由于char只有一个字节,也就是八个比特位所以能存放2^8次方个数字也就是0~255.。
在char中存放有符号整形时,由于最高位会变成符号位,所以2^8个数字就变成了-128~127。(如下图)
在用char中的整形进行运算时,要先进行整形提升,把他们变成四个字节的整形后在运算。signed char补最高位数字,unsigned char直接补零。运算完后存入char中发生截断,最后把补码转换成原码才能得出答案。