在计算机中,数据在内存中以二进制形式存储,负数有三种表示方法:原码,反码,补码。任何正数的原码,反码,补码的形式均相同,而负数有不同的表现形式。
数据在计算机中大都以二进制补码形式存储,原因是:
数的原码表示形式简单,适用于乘除运算,但用原码表示的数进行加减运算比较复杂;引入补码之后,减法运算也可以用加法来实现,且数的符号位也可以当作数值一样参加运算,并且其他运算均是以假发为基础进行运算的;因此在计算机中大都采用补码来进行运算。
好了,废话扯完了!
在c语言中,我们对数据的使用时要注意一些问题:
- 数据溢出:每种数据类型都有一定的范围,不当使用造成数据溢出会造成不可预知的错误:
- 隐式类型转换:不同类型数据在赋值时,如未进行显示转换,编译器会自己进行隐式类型转——其中会从涉及到数据截断和整型提升以及符号位扩充
数据溢出:
给大家一个思考题,猜一下面代码的输出结果:
int main()
{
char a = -128;
char b = 128;
printf("%u %u\n", a, b);
printf("%d %d\n", a, b);
return 0;
}
你是怎么思考的呢?%u打印时思考起来是不是有点困难?那我们先来看看%d打印,都知道%d是按有符号整数类型打印的,那结果就是:-128 128 了,对不对?
那以%u打印的结果是多少呢?我们运行起来看看结果:
这里我们发现:
- a和b无论是以何种方式打印的打印结果均相同
- 以%d形式打印128竟然打印出的结果为-128
- 以%u形式打印a和b竟然都是两个很大的数
怎么会这样?是编译器有问题吗?很明显不是的!
那么我来解释一下,首先char类型的数据是有范围的,其数据类型的范围为:-128~127,那么当给b赋值128时发生了什么?很明显是数据溢出了,那溢出导致的结果呢?我们来看一下给b复制后b在内存中的存储形式:
可以看到b在内存的存放形式为十六进制的80,那么0x80是如何来的呢?我是这样理解的:
128=127+1
127为正数,原,反,补码相同为:0111 1111
同理1的补码:0000 0001
两者相加导致数据溢出使得进位占据了符号位得:1000 0000即为128在内存中的存放形式0x80
同时我还发现-128在内存中的存储形式为0x80,这里就让我很不解了,0x80按照负数的原码补码关系得0x80的原码形式的十进制数为-0啊,不应该是-128啊!这时怎么回事?
简单来说,我的理解就是-0是没有意义的,因此就用0x80作为-128的补码形式,而且-128可以理解为-127-1即(-127+(-1));
当然这里有大佬比我解释的更具体:原浅析为什么char类型的范围是 —128~+127,在此膜拜一下,以表敬意!
理解了这些,就对这段代码的运行结果理解一半了,那么另一半呢?就是%u输出了,很简单,当以%u形式输出时需要对变量扩充为unsigned int类型,a,b在内存中都是0x80,编译器识别为负数即扩充时高位和符号位保持一致,即就是进行了隐式类型转换,a,b扩充的结果为0xff ff ff 80,其转换成十进制为:4294967168
这样这道题就说得通了!
谢谢观阅,如有问题,还请不吝赐教!