math 之 sqrt 0x5f3759df-CSDN博客

这篇博客深入解析了一款老游戏Quake3源码中的快速平方根函数floatQ_rsqrt，展示了如何通过近似算法和特殊常数0x5f3759df达成惊人的计算速度。文章揭示了数学原理并讨论了其与CPU/FPU工作的相似性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

/*
** float q_rsqrt( float number )
*/
float Q_rsqrt( float number )
{
   long i;
   float x2, y;
   const float threehalfs = 1.5F;

   x2 = number * 0.5F;
   y = number;
   i = * ( long * ) &y;                       // evil floating point bit level hacking
   i = 0x5f3759df - ( i >> 1 );               // what the fuck?
   y = * ( float * ) &i;
   y = y * ( threehalfs - ( x2 * y * y ) );   // 1st iteration
//   y = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed

#ifndef Q3_VM
#ifdef __linux__
assert( !isnan(y) ); // bk010122 - FPE?
#endif
#endif
return y;
}

以上代码来自一款老游戏（quake3-1.32b-source）的源码，实现sqrt函数，比C库里面的sqrt函数快了4倍，是最快的sqrt版本；

0x5f3759df 神奇地完成了核心运算，想知道是如何得来的。

2022/8/25更新

在网上看到一则具有出色数学解释：

除某些例外情况外，任何数学函数都可以用多项式和表示：

y = f(x)

可以精确地转换为：

y = a0 + a1*x + a2*(x^2) + a3*(x^3) + a4*(x^4) + ...

其中a0，a1，a2，...是常数。问题在于，对于许多函数(例如平方根)，对于确切值，该和具有无限数量的成员，并且不以某个x ^ n结尾。但是，如果我们在x ^ n处停下来，我们仍然可以得到某种精度的结果。

因此，如果我们有：

y = 1/sqrt(x)

在这种特殊情况下，他们决定丢弃所有高于秒的多项式成员，这可能是由于计算速度所致：

y = a0 + a1*x + [...discarded...]

现在，任务已经结束，可以计算a0和a1，以使y与实际值的差异最小。他们计算出最合适的值为：

a0 = 0x5f375a86
a1 = -0.5