![56c410db11506a84a3a096004ac1c045.png](https://img-blog.csdnimg.cn/img_convert/56c410db11506a84a3a096004ac1c045.png)
一、 介绍
快速平方根倒数算法也称为平方根倒数速算法(Fast Inverse Square Root)是用于快速计算 的一种算法。此算法由于出现在《雷神之锤III竞技场》源代码中而被人们所熟知。此算法最早被认为是由约翰·卡马克所发明,但后来的调查显示,该算法在这之前就于计算机图形学的硬件与软件领域有所应用,此算法至今为止仍未能确切知晓算法中所使用的特殊常数的起源。
下列代码是《雷神之锤III竞技场》源代码中平方根倒数速算法之实例:
![cf5598843d0cfae55684bf982b0312eb.png](https://img-blog.csdnimg.cn/img_convert/cf5598843d0cfae55684bf982b0312eb.png)
二、 浮点数整数储存方式
要理解这段代码,首先需了解浮点数的存储格式。一个浮点数以32个二进制位表示一个有理数,而这32位由其意义分为三段:首先首位为符号位,如若是0则为正数,反之为负数;接下来的8位表示经过偏移处理(这是为了使之能表示-127-128)后的指数;最后23位表示的则是有效数字中除最高位以外的其余数字。将上述结构表示成公式即为:
![0f1a27d05a2dc7347be6bba35f0e818d.png](https://img-blog.csdnimg.cn/img_convert/0f1a27d05a2dc7347be6bba35f0e818d.png)
![3aa02934fa01728c3c98a4b8f6dc01ee.png](https://img-blog.csdnimg.cn/img_convert/3aa02934fa01728c3c98a4b8f6dc01ee.png)
其中m表示有效数字尾数(此处0<=m<=1,偏移量B=127,而指数的值E-B决定了有效数字) 代表的是小数还是整数。以上图为例,m = =0.250,E-B=124-127=-3,所以浮点数的值为x=(1+0.250)x =0.15625。
浮点数储存为整数时,该整数的数值为 I = E x 2^23 + M ,其中E表示指数,M表示有效数字;以上图为例,E=124, M= 2^21 ,则转换后的整数数值为I = 124 x 2^23+ 2^21 。由于平方根倒数函数仅能处理正数,因此浮点数的符号位必为0,而这就保证了转换所得的有符号整数也必为正数。
三、 浮点数平方根倒数近似值
回想上一节关于整数和浮点数表示的比较:对于同样的32位二进制数字,若为浮点数表示时实际数值为 x = (1+mx)2^ex ,而若为整数表示时则实际数值为Ix = ExL + Mx ,其中L = 2^(n-1-b) ,基于上面整数和浮点数的表示,我们进行如下的推到过程:
![028427f13e151399fc01e4007371528d.png](https://img-blog.csdnimg.cn/img_convert/028427f13e151399fc01e4007371528d.png)
对等式y = 1/sqrt(x)两边取二进制对数有:
![093586e904cacd43636287710094a2ae.png](https://img-blog.csdnimg.cn/img_convert/093586e904cacd43636287710094a2ae.png)
以如上方法,就能将浮点数x和y的相关指数消去,从而将乘方运算化为加法运算。由于log2x和log2x^(-1/2)线性相关,因此输入值和首次近似值间可以线性组合的方式创建方程。在此McEniry再度引入新数σ描述log 2 ( 1 + x )与近似值R间的误差。由于0<=x<=1时,有log 2 ( 1 + x ) 约等于 x,则再次可以定义σ与x的关系为log 2 ( 1 + x ) = x + σ,代入上面有:
![999f7431eeda01cb8941d66014101c42.png](https://img-blog.csdnimg.cn/img_convert/999f7431eeda01cb8941d66014101c42.png)
代入 Ex,Mx , B和L有:
![999f7431eeda01cb8941d66014101c42.png](https://img-blog.csdnimg.cn/img_convert/999f7431eeda01cb8941d66014101c42.png)
移项整理得到:
![b3e3a5aba83afa4f0f3528eeb47ae8fa.png](https://img-blog.csdnimg.cn/img_convert/b3e3a5aba83afa4f0f3528eeb47ae8fa.png)
如上所述,对于以浮点规格存储的正浮点数x,若将其作为长整型表示则示值为Ix = ExL + Mx ,的可以得到x的整数导出y的整数表示值为:
![270744055c4cec6c489b21580a96719b.png](https://img-blog.csdnimg.cn/img_convert/270744055c4cec6c489b21580a96719b.png)
最后导出式Iy = R - 0.5Ix 与代码中的i = 0x5f3759df - (i>>1)相匹配,由此可见,在平方根倒数速算法中,对浮点数进行一次移位操作与整数减法,就可以可靠地输出一个浮点数的对应近似值,McEniry只证明了,在常数R的辅助下,可近似求取浮点数的平方根倒数,但仍未能确定代码中的R值的选取方法。
![3d656b233297e320f8c820cb4c9d6abf.png](https://img-blog.csdnimg.cn/img_convert/3d656b233297e320f8c820cb4c9d6abf.png)
四、 牛顿迭代法改善进度
在进行了如上的整数操作之后,示例程序再度将被转为长整型的浮点数回转为浮点数(x = *(float*)&i;),并对其进行一次浮点运算操作(x = x*(1.5f - xhalf*x*x);),这里的浮点运算操作就是对其进行一次牛顿法迭代,若以此例说明:
![00116824cf6ac773e29e2e4cca0603a2.png](https://img-blog.csdnimg.cn/img_convert/00116824cf6ac773e29e2e4cca0603a2.png)
![cee80ecedd55e1e15f0289c312c8c0ad.gif](https://img-blog.csdnimg.cn/img_convert/cee80ecedd55e1e15f0289c312c8c0ad.gif)