整形在内存中的存储
在计算机中整数有三种二进制表示方法,分别为原码,反码,补码
三种表示方法均有符号位和数值位两部分,符号位用 ‘ 0 ’表示正 用 ‘ 1 ’表示负。
正数的三种表示方法相同
负数的各不相同
原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码
反码
原码的符号位不变,数值位按位取反,得到反码
补码
反码+1得到补码
对于整形来说,数据存放内存中其实存放的是补码。
在计算机系统中,数值一律用补码来表示和存储,原因在于,使用补码可以使符号位和数值域统一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
大小端介绍
什么是大端小端?
大端(存储)模式:是指数据的低位保存在内存的高地址中,数据的高位保存在内存的低地址中;
小端(存储)模式:是指数据的低位保存在内存的低地址中,数据的高位保存在内存的高地址中。
为什么有大小端?
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
判断机器是大端模式还是小端模式的C代码
#include<stdio.h>
int check_sys()
{
int a = 1;
return *(char*)&a;
}
int main()
{
if (check_sys() == 1)
printf("小端\n");
else
printf("大端\n");
return 0;
}
判断下列C代码的运行结果
#include<stdio.h>
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a=%d b=%d c=%d\n", a, b, c);
return 0;
}
分析:
-1是一个整形数字,
原码为:1000 0000 0000 0000 0000 0000 0000 0001
反码为:1111 1111 1111 1111 1111 1111 1111 1110
补码为:1111 1111 1111 1111 1111 1111 1111 1111
-1是一个整形数字,但是a是一个char类型的变量,只有一个字节,但是-1有四个字节,无法将-1全部值赋值给a,只能将-1截断后(截断低位)赋值给a,
即 1111 1111,在打印的时候,自动填补,因char 在VS编译器中表示有符号的char类型,所以符号位为1则在前面补1,符号位为0则补0,所以最终结果为
1111 1111 1111 1111 1111 1111 1111 1111,也就是-1的补码,所以最终打印为-1;
在VS编译器中,char 和 signed char 是等价的,所以a和b的分析相同,不做赘述。
对于变量 c 而言,其类型为unsigned char ,之前的步骤与a b相同,c被赋值为
1111 1111 ,在填补的时候,因c是unsigned char 类型,所以自动补0,即
0000 0000 0000 0000 0000 0000 1111 1111,是255的补码,所以c的打印的值为255。