1.提出问题:精度和动态范围之间的矛盾
转化结果为:a = (1 << 14) - (b << 6) / (c >> 8);
先确定数值的界,也就是定点的字长,然后把浮点转化为定点格式
精度=>小数的位数n=>浮点数乘2^n并取整=>加法直接运算,乘法后除以2^n,除法后乘以2^n
2.解决方法:范围
1).除法转换为乘法或者移位运算
2).查表计算
3).级数展开,2和3一般针对复杂的数学公式
4).分子分母同时变化
3. 解决精度不足的方法:更长字长,加半位,整数模拟,查表
4. 具体步骤:推断算法每一步结果的动态范围。对复杂算法不可行,此时需要做动态的normalization或者通过尝试得到大致动态范围(常有例外)。
比如:a = 1 - (b/c);其中b < pow(2, 23), c = pow(2, 26);转化结果为:a = (1 << 14) - (b << 6) / (c >> 8);
先确定数值的界,也就是定点的字长,然后把浮点转化为定点格式
精度=>小数的位数n=>浮点数乘2^n并取整=>加法直接运算,乘法后除以2^n,除法后乘以2^n
溢出问题怎么处理?
5. 其他
定点数和浮点数的差别:
1.表示的精度和范围不同
2.运算复杂度不同
3.硬件依赖性