浮点数
32bit的浮点数包括了1个bit的signed 和 8bits 的 exponent,和23bits的significant。其中exponent00000000和11111111保留。所以最大和最小数如下图所示
浮点加法
将小的数的exponent shift right,然后正常化和取整如果有必要的话。hw的结构如下
注意exponents减了两次127,实际上只要减一次。
同时浮点数加法不满足结合律,因为可能计算机表示浮点数是近似表示
32bit的浮点数包括了1个bit的signed 和 8bits 的 exponent,和23bits的significant。其中exponent00000000和11111111保留。所以最大和最小数如下图所示
将小的数的exponent shift right,然后正常化和取整如果有必要的话。hw的结构如下
注意exponents减了两次127,实际上只要减一次。
同时浮点数加法不满足结合律,因为可能计算机表示浮点数是近似表示