规格化的浮点数因为存储是使用类似科学计数法的表示,因此计算方法大体上与科学计数法较为类似。
浮点加减法
浮点加减法的一般步骤(减法本质也是加法):
对于二进制形式的两个浮点数相加
1. 对阶:对于两个规格化浮点数,将较小的指数的数向较大指数的数对齐。通过移动小数点实现。如果出现有效数字位数不能满足的情况,进行近似。
2. 相加尾数(有效数):将两个二进制数的尾数相加。
3. 规格化处理:对已经求得的结果进行规格化处理。即移动小数点位数,使之满足规格化的形式。
4. 按照有效数字位数进行舍入处理。
5. 判断是否出现溢出。
对于浮点数 (−1)s(1+M)×2e 溢出有几种情况:
(1)阶码上溢: e>128 ,将其处理为正负无穷。
(2)阶码下溢: