下面这个求的函数号称比直接调用sqrt库函数快4倍,来自游戏Quake III的源代码。
分析程序之前,我 们必须解释一下 float数据在 计算机里的表示方式。一般而言,一个 float数据 共32个bit,和int数据一 样。其中前 23位 为有效数字 ,后面接着一个8位数据 表示指数,最后一位表示符号,由于 这里被开方的数总是大于 0,所以我 们暂不考虑最后一个符号位。此时
如果我 们把计算机内的浮点数 看做一个整数 ,那么
现在开始逐步分析函数。这个函数的主体有四个语句,分别的功能是:
int i = *( int *)&x; 这条语句把 转成 。
i = 0x5f3759df - (i>>1); 这条语句从 计算 。
x = *( float *)&i; 这条语句将 转换为 。
x = x*(1.5f - xhalf*x*x); 这时候的 x是近似解;此步就是 经典的牛顿迭代法。迭代次数越多越准确。
关 键是第二步 i = 0x5f3759df - (i>>1); 这条语句从 计算 ,原理:
令 ,用 和 带入之后两边取对数,再利用近似表示 ,算一算就得到
若取 , 就是程序里所用的常量0x5f3759df。至于 为何选择这个 , 则应该是曲线拟合实验的结果 。
float InvSqrt (float x){
float xhalf = 0.5f*x;
int i = *(int*)&x;
i = 0x5f3759df - (i>>1);
x = *(float*)&i;
x = x*(1.5f - xhalf*x*x);
return x;
}
我
们这里分析一下它的原理(指程序的正确性,而不是解释为何快)。
分析程序之前,我 们必须解释一下 float数据在 计算机里的表示方式。一般而言,一个 float数据 共32个bit,和int数据一 样。其中前 23位 为有效数字 ,后面接着一个8位数据 表示指数,最后一位表示符号,由于 这里被开方的数总是大于 0,所以我 们暂不考虑最后一个符号位。此时
如果我 们把计算机内的浮点数 看做一个整数 ,那么
现在开始逐步分析函数。这个函数的主体有四个语句,分别的功能是:
int i = *( int *)&x; 这条语句把 转成 。
i = 0x5f3759df - (i>>1); 这条语句从 计算 。
x = *( float *)&i; 这条语句将 转换为 。
x = x*(1.5f - xhalf*x*x); 这时候的 x是近似解;此步就是 经典的牛顿迭代法。迭代次数越多越准确。
关 键是第二步 i = 0x5f3759df - (i>>1); 这条语句从 计算 ,原理:
令 ,用 和 带入之后两边取对数,再利用近似表示 ,算一算就得到
若取 , 就是程序里所用的常量0x5f3759df。至于 为何选择这个 , 则应该是曲线拟合实验的结果 。