gpu线程分支

黯止依蓝

于 2024-04-10 14:55:04 发布

阅读量255

点赞数 8

分类专栏： gpu模拟器文章标签： gpu模拟器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kongxiangyunltj/article/details/137595191

版权

gpu模拟器专栏收录该内容

8 篇文章 0 订阅

订阅专栏

假设如上情况线程分支

分支之前是跳转指令，插入cbj，记录当前a码和w码，（activa和wait），1111和0000

紧接着是跳转指令，A要分为B和F，我们假设B为ture，下一条pc+4，F为false，pc+imm

假设策略先执行少的，设置pc为pc+imm。

那么我们会将B的下一跳pc信息以及活跃码信息压入栈，即pc+4和1110

那么下一个循环执行F，执行完之后遇到cbj指令，cbs指令，

因为和A之前的cbj指令是相对应的，所以会找到A指令之前的cbj存的a、w码，那么合并之后发现a、w码并不相等，那么说明还有分支没有执行，那么改变w码为0001，从栈里弹出B的pc+4以及掩码1110

这时候又遇到cbj指令，同样的操作，记录B的a码和w码1110 0000

然后是分支指令，我们假设C为ture，下一条pc+4，D为false，pc+imm

因为C少，所以存D的pc+imm,掩码0110进栈

下一条执行C，执行C之后会遇到cbs指令，那么查看的是B存的信息，改变w码为1000，发现和a码不一样，那么弹D信息出栈

当D执行完毕之后，改变B的W码为1110，发现等于B的a码1110，说明B的所有分支重聚，那么当前a码改为1110，然后继续执行D的下一条指令

E执行完成之后，遇到cbs，那么这是A的，A现在的信息为1111 0001合并a码之后为1111，和w码一样，说明合并完毕，然后所有线程继续往下执行

指令分布示例

这边以wrap方式执行指令为跳转和一些扩展指令，比如mma，使用tensor core的，是以pu为单位的资源，和线程没关系。

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
gpu线程分支

因为和A之前的cbj指令是相对应的，所以会找到A指令之前的cbj存的a、w码，那么合并之后发现a、w码并不相等，那么说明还有分支没有执行，那么改变w码为0001，从栈里弹出B的pc+4以及掩码1110。E执行完成之后，遇到cbs，那么这是A的，A现在的信息为1111 0001合并a码之后为1111，和w码一样，说明合并完毕，然后所有线程继续往下执行。当D执行完毕之后，改变B的W码为1110，发现等于B的a码1110，说明B的所有分支重聚，那么当前a码改为1110，然后继续执行D的下一条指令。
复制链接

扫一扫

专栏目录

黯止依蓝 CSDN认证博客专家 CSDN认证企业博客

码龄4年

113: 原创

21万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1870: 积分

523: 粉丝

725: 获赞

13: 评论

627: 收藏

私信

关注

热门文章

分类专栏

最新评论

triton矩阵乘以及缓存优化
chentb1990: 这里用574/64=9,所以num_pid_m和num_pid_n都是81 这句话是啥意思呢
在linux上使用vs调试代码
CSDN-Ada助手: 恭喜您写了第6篇博客！标题看起来非常有趣和实用。在Linux上使用VS调试代码对于许多开发者来说可能是一个需要解决的难题。您的博客无疑能够为大家提供非常有用的指导和技巧。我非常期待阅读您的这篇博客，并从中学到更多关于在Linux上使用VS调试代码的方法。同时，我建议您在未来的创作中，可以探讨一些更加深入的主题，例如如何优化调试过程或者如何处理特定类型的错误。谢谢您的分享！
xv86 关于shell、控制台console是怎么打印$,即时回显键盘输入字符，以及解析命令的
CSDN-Ada助手: 恭喜你写了这么有深度和技术含量的博客，对于shell和控制台console的解析和实时回显键盘输入字符的探究非常有见地。不过，在接下来的创作中，或许可以考虑加入一些实际案例或者应用场景，让读者更容易理解和接受这些技术知识。期待你更多的精彩内容，加油！
关于锁的两点
CSDN-Ada助手: 非常精彩的博客标题！恭喜您写了第12篇博客，这是一个了不起的成就。您对于“关于锁的两点”这个主题进行了深入的探讨，让读者受益匪浅。我真诚地希望您能继续保持创作的热情和努力，为我们呈现更多精彩的内容。在下一步的创作中，或许您可以考虑拓展一下关于锁的相关内容，比如各种类型的锁及其应用场景，锁的演变历程，或是探索一些与锁相关的新技术等等。这样的创作将进一步丰富您的博客内容，使读者们更加期待您的下一篇博文。期待您的精彩续作！
IEEE 754
CSDN-Ada助手: 恭喜您写了第13篇博客！IEEE 754是一个非常重要的主题，您的解释和分析让我受益匪浅。希望您能继续分享关于计算机科学和技术的知识，也许下一步可以探讨一下最新的计算机处理器架构或者数据存储技术。谢谢您的分享，期待您的下一篇作品！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。