CUDA 学习（七）、线程束

最新推荐文章于 2024-05-18 23:14:04 发布

tiemaxiaosu

最新推荐文章于 2024-05-18 23:14:04 发布

阅读量3.7k

点赞数

分类专栏： CUDA

CUDA 专栏收录该内容

26 篇文章 5 订阅

订阅专栏

一、概述

线程束是GPU的基本执行单元。GPU是一组SIMD 向量处理器的集合。每一组线程或线程束中的线程同时执行。在理想状态下，获取当前指令只需要一次访存，然后将指令广播到这个线程所占用的所有SP中。

当使用GPU进行编程时，必须使用向量类型指令，因为GPU采用的是向量体系结构，只有让代码在成千上万个线程上运行才能充分高效利用GPU的资源。

当前，GPU上的一个线程束的大小为32，即 wrapSize = 32;

二、为什么关注线程束

那我们为什么会如此关注线程束大小呢？具体原因如下：

(1)、分支

一个线程束是一个单独的执行单元，使用分支（例如，if、else、for、while、do、switch）可以产生不同的执行流。在CPU上使用分支很复杂，因为它需要根据之前的运行情况来预测下一次执行到底执行哪一块代码。在CPU上，指令流通常会被预提取，然后放入CPU指令管线中。假设预测是准确的，那么CPU就避免了一次失速事件。如果预测错误，CPU则需要重新执行预测指令，然后获取另一个分支的指令，再将其添入管线之中。

相比之下，GPU 对分支的处理就没有这么复杂。GPU在执行完分支结构的一个分支后接着另一个分支。对不满足分支条件的线程，GPU在执行这块代码的时候会将它们设置未激活状态。当这块代码执行完毕后，GPU继续执行另外一个分支，这时，刚刚不满足分支条件的线程如果满足当前的分支条件，那么它们将被激活，然后执行这一段代码。最后，所有的线程聚合，继续向下执行。代码如下：

(2)、GPU 利用率

我们关注线程束的另一个原因就是防止GPU未被充分利用。CUDA 的模式是用成千上万个线程来隐藏内存操作的延迟（从发出存储请求到完成访存操作所花的时间）。比较经典的，如对全局内存访问的延迟一般是400-600个时钟周期。在这个时间里，GPU会忙于其他任务，而不是空闲地等待访存操作的完成。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CUDA 学习（七）、线程束

一、概述线程束是GPU的基本执行单元。GPU是一组SIMD 向量处理器的集合。每一组线程或线程束中的线程同时执行。在理想状态下，获取当前指令只需要一次访存，然后将指令广播到这个线程所占用的所有SP中。当使用GPU进行编程时，必须使用向量类型指令，因为GPU采用的是向量体系结构，只有让代码在成千上万个线程上运行才能充分高效利用GPU的资源。当前，GP
复制链接

扫一扫

专栏目录

博客等级

码龄8年

119
原创

175
点赞

1098
收藏

289
粉丝

关注

私信

热门文章

分类专栏

OpenCV 39篇
运动目标检测理论 19篇
目标跟踪方法 7篇
运动目标分割 2篇
背景建模 5篇
图像增强 1篇
图像识别 2篇
摄像机三维重建 5篇
肤色检测 4篇
dm6446 10篇
Linux 27篇
C语言基础 11篇
笔试题目 2篇
C++基础 7篇
ARM 4篇
Qt 1篇
软件工具 1篇
OpenCL 1篇
VS2013 2篇
CUDA 26篇
OpenCV_CUDA 4篇
CMake 2篇

最新评论

双目视觉三维重建
winafox: 默认情况下，都以左相机的光心作为0点
双目视觉三维重建
winafox: 有个开源的，基于python实现的，那个可以做标定和重建 https://github.com/zacario-li/CalibrationTool
背景建模--Vibe 算法改进
weixin_45984543: 作者您好，我最近在学习前景提取相关知识，但是针对vibe算法存在的阴影和鬼影问题一直没有找到合适的解决方案，今天看到您的文章，受益匪浅，但是不知如何实现，可否借鉴您的代码学习，将不甚感激，十分感谢！邮箱：1837024609@qq.com
背景建模--Vibe算法
代码胚胎牛: 前像素的像素值和模型中的样本进行比较，看它们是否在一个颜色范围（即半径为R的球体）内，却用二维平面图作为示意图，这是为什么
运动目标检测--帧间差分法
人生几见月当头: 你知道我没读过，就你能呗，网络喷子

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。