SummedAreaTable

最新推荐文章于 2023-11-11 15:16:35 发布

安柏霖

最新推荐文章于 2023-11-11 15:16:35 发布

阅读量5.2k

点赞数 3

文章标签： float table filter performance 多线程 cache

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/toughbro/article/details/5117900

版权

1984年的始祖文章：

http://www.soe.ucsc.edu/classes/cmps160/Fall05/papers/p207-crow.pdf

后来的一些：

http://www.shaderwrangler.com/publications/sat/SAT_EG2005.pdf （这个比较好）

http://ati.amd.com/developer/gdc/GDC2005_SATEnvironmentReflections.pdf

summed area table对应的技术最接近的是mipmap，mipmap每一阶的标准做法是上一阶对应的4个像素的平均（某些情况是2个）。

也就是说在mipmap的情况下我们要拿一些平均过的texel就被局限到这种正方形（某些情况是长方形）的kernal里，如果想有更多种类的取法，1*3,2*5这种，那么会直接导致性能变化剧烈。

summed area table则提供了可以在恒定时间（如果不考虑texture sample cache效率，认为texture sample都是一样时间的话）在一定范围内任意矩形的sample kernel。

实际应用中，真正比mipmap强力的地方大抵是这些，在summed area table variance shadow map里有个比较好的实例应用：

http://http.developer.nvidia.com/GPUGems3/gpugems3_ch08.html

尤其是里面percentage closer shadow map那个应用。

先上算法，给定一个texture，需要先构建这个summed area table:

里面每个element是它左边和上面所有texel的值的和。

图示：

filter summed area table,在使用SAT的时候，根据要sample的kernel，结果的定义：

filter这一步可以看到，只要取4个pixel就可以实现对任意矩形形状内部的texel的平均值计算，这也是SAT强力的地方。

代码：

float4tex2D_SAT_blur(samplertSAT, float2uv, float2size) { float4result = tex2D(tSAT, uv+ 0.5 * size); // LR result -= tex2D(tSAT, uv+ float2(0.5, -0.5) * size); // UR result -= tex2D(tSAT, uv+ float2(-0.5, 0.5) * size); // LL result += tex2D(tSAT, uv-0.5 * size); // UL result /= size.x* size.y; return result; }

具体应用的时候效率和精度是考虑重点，构建SAT过程中有用到一个recurcive doubling的方法来快速构建。

recursive doubling就是一种非常适合多线程并行计算的东西，单线程的pipeline指令也可以从中受益很多，图示：

这样log_2（n）次可以搞定。

实际应用中，每个pass可以sample更多的texel，而且可以再log_sample_num(n)pass构建好。

另一个是精度问题，因为存的东西可能值非常大，所以需要24bit或者32bit精度的texture来保存，这个有点寒。。。

另外偏移0.5在sample初始texture和构建SAT过程中也会增加一些精度。

所以总体下来，不太好说这个技术好用不好用。

虽然在adaptive kernel上有好的表现，但是更多的pass和精度要求又带来performance和空间上的消耗。

另外比如说要把shadow map升级到pcss这种，这个就要有额外的开销，这个只有要实现出来profile了才能做最后的决定。

但是的确是一个很有意思的技术。

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
SummedAreaTable

1984年的始祖文章：http://www.soe.ucsc.edu/classes/cmps160/Fall05/papers/p207-crow.pdf 后来的一些：http://www.shaderwrangler.com/publications/sat/SAT_EG2005.pdf （这个比较好）http://ati.amd.com/developer/gdc/GDC
复制链接

扫一扫

安柏霖

CSDN认证博客专家 CSDN认证企业博客

码龄18年

890: 原创

1万+: 周排名

5677: 总排名

230万+: 访问

: 等级

3万+: 积分

1763: 粉丝

597: 获赞

652: 评论

479: 收藏

私信

关注

热门文章

分类专栏

亲子 1篇
lifehack 2篇
游戏开发 47篇
Engine&Render 242篇
LowLevel 38篇
Misc 136篇
Tools 23篇
WaterDrops 41篇
随笔 146篇
Game 6篇
Book 45篇
General 21篇
Mobile
productivity 3篇
c++ 8篇
Management
Design 2篇
开发探索 19篇
animation&physics 1篇

最新评论

[运营期间开发]卡顿处理--GPUView
wjsgtxy: 稳定搞定的操作，我这边还是无法加载symbol(symbol没有问题，别人的机器反复尝试可以成功)
从数据到智慧
antsmallant: 原则非常有用，对原则进行归纳非常有必要，瑞.达利欧直接就写了两本书《原则》《原则：应对变化中的世界秩序》。
实战型开发1/3--结果&业务导向
antsmallant: 这个 “程序团队自己来写一份相对详细的策划文档：以这个形式来保证对于业务的熟悉，这个虽然会花费一些时间，但是其重要性甚至高于程序中的comments，避免犯方向上的错误；” 做法挺妙的。
jetbrain account不能访问的问题
MFD_123: 这是加的域名解析，直接访问你本机了
[sig16]《神秘海域4》中的volumetric-based materials
宿舍探险家: 求模型链接

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。