[6] CUDA之线程同步

明月醉窗台

于 2024-05-26 12:43:02 发布

阅读量1.1k

点赞数 24

分类专栏： CUDA - Opencv 文章标签： CUDA 人工智能计算机视觉 NVIDIA 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yohnyang/article/details/139212115

版权

CUDA - Opencv 专栏收录该内容

26 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

CUDA之线程同步

共享内存：线程时间需要互相交换数据才能完成任务的情况并不少见，因此，必须存在某种能让线程彼此交流的机制
当很多线程并行工作并且访问相同的数据或者存储器位置的时候，线程间必须正确的同步
线程之间交换数据并不一定要需要使用共享内存，只是共享内存较快而已

1.共享内存

共享内存位于芯片内部，因此它比全局内存要快得多，相比没有经过缓存的全局内存访问，共享内存大约在延迟上第100倍
同一个块中的线程可以访问相同的一段共享内存，不同块中的线程所见到的共享内存中的内容是不相同的
如果某线程的计算结果在写入到共享内存完成之前被其他线程读取，那么将会导致错误。因此应该正确的控制和管理内存访问，这是由 __syncthreads() 指令完成的，该指令确保在继续执行程序之前完成对内存的所有写入操作，即同步，也被称为 barrier。barrier的含义是块中的所有线程都将到达该代码行，然后在此等待其他线程完成，当所有线程都到达了这里之后，他们可以一起继续往下执行
举个例子：


#include <stdio.h>

//

了解本专栏

超级会员免费看

明月醉窗台

关注

24
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
[6] CUDA之线程同步

[6] CUDA之线程同步
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

明月醉窗台 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。