0阶贝塞尔函数_Shader优化--耗时数学函数的快速计算方式汇总

最新推荐文章于 2020-11-27 04:43:26 发布

weixin_39597318

最新推荐文章于 2020-11-27 04:43:26 发布

阅读量151

点赞数

文章标签： 0阶贝塞尔函数

转载请注明出处：https://zhuanlan.zhihu.com/p/130428432

说明

这是我在学习压缩格式(HDR格式,RGBE编码)时突发奇想，想到的一个优化思路，我估计游戏厂商也早已有这方面经验积累，但资料略少，就整理了一些。

渲染优化，除了场景管理，LOD，管线优化，裁剪，分辨率，mipmaps等，计算上也可以优化。本文主要列举计算中常用到的耗时的公式的优化。

公式优化的思路就是若库函数效率低下就用特化版本或者近似版本。需要慢慢积累，形成一个快速计算数学库。

内容多来自IDTech6、7和github的一个开源库

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

我重新整理了一份，新增了若干项。放在github上：

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h

前置计算机或数学基础知识关键词：

ALU、NewtonRaphson迭代、IEEE

特化

1.pow(x)

直接特化对应版本

比如

float

近似

pow(x)

还是pow，这是idtech6、7里看到的。

float

log2(x)

这是在idtech6、7里看到的

float

exp2(x)

这是在idtech6、7里看到的

float

RCP

// RCP

基于NR的sqrt

//基于IEEE浮点整数浮点数算法的近似值计算

acos

4阶多项式逼近

4 VGRP,16 ALU

7*10^-5弧度精度

资料：Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

float

asin

4阶多项式逼近

4 VGRP,16 ALU

7*10^-5弧度精度

float

atan

4阶多项式逼近

4 VGRP,12 ALU

7*10^-5弧度精度

资料：Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

float

资料

https://github.com/michaldrobot/ShaderFastLibs/blob/master/ShaderFastMathLib.h

Efficient approximations for the arctangent function, Rajan, S. Sichun Wang Inkol, R. Joyal, A., May 2006

Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

https://github.com/ifeuille/FastMathTests/blob/master/ShaderFastMathLib.h

weixin_39597318

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
0阶贝塞尔函数_Shader优化--耗时数学函数的快速计算方式汇总

转载请注明出处：https://zhuanlan.zhihu.com/p/130428432说明这是我在学习压缩格式(HDR格式,RGBE编码)时突发奇想，想到的一个优化思路，我估计游戏厂商也早已有这方面经验积累，但资料略少，就整理了一些。渲染优化，除了场景管理，LOD，管线优化，裁剪，分辨率，mipmaps等，计算上也可以优化。本文主要列举计算中常用到的耗时的公式的优化。公式优化的思路就是若库函...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。