一、浮点数加减运算的步骤
- 对阶:小阶向大阶对齐,阶小的那个数尾数右移,对于IEEE754标准表示的浮点数来说,右移时要注意将隐含的一位1右移到小数部分
- 尾数加减:注意要先还原隐藏位
- 尾数规格化:直到将第一位1移到小数点左边
- 右规:尾数右移一位,阶码加1;
- 左规:尾数左移一位,阶码减1
- 尾数的舍入处理:在对阶和尾数右规时,可能会对尾数进行右移。一般将低位移出的位参与一些运算后再对结果进行舍入
- 溢出判断:在尾数规格化和尾数舍入时,可能会对结果的阶码执行加减运算。浮点数的溢出并不以尾数溢出来判断,而主要是看结果的指数是否发生了上溢,因此是由指数上溢来判断的
- 两种溢出
- 指数上溢:一个正指数超过了最大允许值:127(对应规格化数,移码11111110)或1023
- 指数下溢(即绝对值过小时直接判为0):一个负指数超过了最小允许值:-149(对应非规格化小数,移码00000000+尾数000…01)或-1074
- 可能导致溢出的情况:即所有涉及阶码运算的情况
- 右规和尾数舍入:一个数值很大的尾数舍入时,可能因为末位+1而发生尾数溢出,此时就需要调整尾数和阶码(尾数右规、阶码+1)。若调整前或后阶码全为1,则直接置结果为指数上溢;否则正常
- 左规(即会导致指数下溢):左规时阶码减小,故需判断是否发生指数下溢。判断规则就是看阶码是否为全0(这里有两种说法,一种是阶码全0就判断为下溢(IEEE规格化),一种是指数超过最小允许值-149(-126-23)才判断下溢(IEEE非规格化小数),如果没表示的话应该按照第一种全0说法)
- 两种溢出
二、关于上溢和下溢
注:上面第二张图并不是IEEE标准的表示范围,只是用来展示上溢和下溢说法的
二、关于浮点数溢出
袁书原话是:浮点数的溢出并不以尾数溢出来判断,尾数溢出可以通过右规操作得到纠正。运算结果是否溢出主要看结果的指数是否发生了上溢,因此是由指数上溢来判断的。
但我猜如果题目问到浮点数溢出,应该阶码上溢和阶码下溢都算。最没毛病的,就是题目明确给出是上溢还是下溢了。
三、相关题目
- 一道选择:
答案是D - 其中一小问:f1(24)和f2(24)的返回值分别为33554431和33554432.0,为什么不相等?
答:当n=24时,f(24)=1 1111 1111 1111 1111 1111 1111 B,而float型数只有24位有效位,舍入后数值增大,所以f2(24)比f1(24)大1.