OpenGL3.3-着色器if-else问题

最新推荐文章于 2024-01-30 14:36:11 发布

原创最新推荐文章于 2024-01-30 14:36:11 发布 · 752 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

opengl 专栏收录该内容

71 篇文章

订阅专栏

本文探讨了GPU中的着色器如何利用SIMD（单指令多数据）和SIMT（单指令多线程）进行高度并行计算。SIMD在同一组数据上执行相同指令，而SIMT允许线程执行不同指令但可能导致等待。Warp是GPU中并行执行的线程组，行动掩码用于决定分支执行。优化GPU程序时，应避免过多的if-else结构以减少效率损失。此外，合并存储访问机制提高内存读取效率，确保连续内存块的高效读取。

首先我们知道着色器是GPU上面的小程序他是运行在GPU上面的
而GPU的特点是高度并行的

SIMD

single instruction multiple data
一条运算指令在多个数据上执行同时计算出结果
例如十六个线程执行的指令都是一样的这样方便计算出多个顶点的变化

SIMT

single intruction multiple thread
与simd类似但是可以处理指令的分支但是会造成等待和压力
例如有16个线程可以8个执行if 8个执行else

warp

GPU中并行执行的一组线程同城为一个warp
一个warp可以是16-64个线程

action mask

他的每一位代表当前warp中每一个线程在分支中是否需要执行
如果action mask所有值都是0 那就说明所有的线程都是执行其中一个分支所以我们就不需要执行另一个分支了这样执行效率就更高如果action mask中有0也有1 则所有分支都可能被执行也就是if和else的语句都需要被执行一遍在SIMD中我们并不能一部分线程去执行if 一部分线程去执行else 所以就会导致warp执行速度会变慢那么如果if和else都执行了我们怎么知道取哪一个呢
在执行操作得到结果将结果存入寄存器时会有一个掩码判断操作会决定那个结果将被存入寄存器中那么没有存入的那部分就造成了空转就造成了效率降低所以我们要尽量避免写if和else

合并存储访问机制

就是每次从内存中读取32-128byte的连续内存块称做transaction
如果当前warp读取的全部数据都落在一个transaction内则只需要读取一次

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。