[cgdc12][amd]DirectCompute的应用

最新推荐文章于 2018-10-26 08:31:01 发布

安柏霖

最新推荐文章于 2018-10-26 08:31:01 发布

阅读量4.1k

点赞数

分类专栏： Engine&Render 文章标签： shader filter 工具

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/toughbro/article/details/7880677

版权

Engine&Render 专栏收录该内容

242 篇文章 25 订阅

订阅专栏

cgdc12的一个文章，amd的高级工程师:冉锦,带来。

着重介绍direct compute的一些东西，DirectCompute可以说是realtime rendering后面的一个重要趋势。

概念

线程组：

GPU里面是以一组计算单元为单位来运行的，amd称之为wave，是显卡并行的最小单元，如果wave是32个计算单元，那么用了一个8线程的运算，就会造成24线程的浪费

DirectCompute都是以线程组的方式来并行做的，那么在确认线程组数量的时候需要是wave计算单元的整数倍，才不会造成浪费。

共享内存：

每个wave里面有一个共享内存，最大是64kb，这个可以说是DirectCompute比传统的shader计算更快的一个重要地方。

工具

amd提供了GPUPerfStudio2来做debug和profile工具。

DirectCompute优势计算类型

就是可以利用上共享内存的计算类型，比如说是需要一个大kernel的filter类，pixel shader里面没有共享内存，每个fragment要自己收集足够信息。

而在direct compute里面可以把临近的pixel的计算结果或者内存的收集情况进行共享。

围绕这点，可以有：

大kernel的gaussian blur
dof
HDAO的bilateral filter
基于tile的光照剪切

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

安柏霖

CSDN认证博客专家 CSDN认证企业博客

码龄18年

890: 原创

1万+: 周排名

5677: 总排名

230万+: 访问

: 等级

3万+: 积分

1763: 粉丝

597: 获赞

652: 评论

479: 收藏

私信

关注

热门文章

分类专栏

亲子 1篇
lifehack 2篇
游戏开发 47篇
Engine&Render 242篇
LowLevel 38篇
Misc 136篇
Tools 23篇
WaterDrops 41篇
随笔 146篇
Game 6篇
Book 45篇
General 21篇
Mobile
productivity 3篇
c++ 8篇
Management
Design 2篇
开发探索 19篇
animation&physics 1篇

最新评论

[运营期间开发]卡顿处理--GPUView
wjsgtxy: 稳定搞定的操作，我这边还是无法加载symbol(symbol没有问题，别人的机器反复尝试可以成功)
从数据到智慧
antsmallant: 原则非常有用，对原则进行归纳非常有必要，瑞.达利欧直接就写了两本书《原则》《原则：应对变化中的世界秩序》。
实战型开发1/3--结果&业务导向
antsmallant: 这个 “程序团队自己来写一份相对详细的策划文档：以这个形式来保证对于业务的熟悉，这个虽然会花费一些时间，但是其重要性甚至高于程序中的comments，避免犯方向上的错误；” 做法挺妙的。
jetbrain account不能访问的问题
MFD_123: 这是加的域名解析，直接访问你本机了
[sig16]《神秘海域4》中的volumetric-based materials
宿舍探险家: 求模型链接

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。