第二篇：CUDA 并行编程简介

最新推荐文章于 2024-08-09 15:36:16 发布

Tiger-Li

最新推荐文章于 2024-08-09 15:36:16 发布

阅读量1k

点赞数

分类专栏：并行计算&GPU&CUDA&OpenMP

并行计算&GPU&CUDA&OpenMP 专栏收录该内容

74 篇文章 23 订阅

订阅专栏

第二篇：CUDA 并行编程简介

阅读目录

回到顶部

前言

并行就是让计算中相同或不同阶段的各个处理同时进行。

目前有很多种实现并行的手段，如多核处理器，分布式系统等，而本专题的文章将主要介绍使用 GPU 实现并行的方法。

参考本专题文章前请务必搭建好 CUDA 开发平台，搭建方法可以参考上一篇文章。

回到顶部

GPU 并行的优缺点

优点：

1. 显存具有更大的内存带宽

2. GPU 具有更大量的执行单元

3. 价格低廉

缺点：

1. 对于不能高度并行化的工作，能带来帮助不大。

2. 对于绝大多数显卡型号，CUDA 仅支持 float 类型而不支持 double 类型运算，因此运算精度不高。

3. 目前还没有出现通用的 GPU 并行编程标准。

4. 处理前需要先将数据传输进显存，增加了一些时间开销。

5. 需要特定显卡型号(英伟达)的支持

较之 CPU ，GPU 适合一次性进行大量相同的工作，而 CPU 则比较有弹性，能同时进行变化较多的工作。

回到顶部

CUDA 结构

CUDA 是一种底层库，比 C/C++ 等语言以及 Open CV 之类的库更加底层，是附加在操作系统和这类程序之间的一层：

回到顶部

CUDA 程序架构

CUDA 架构下，程序分成两个部分：host 端和 device 端，前者在 CPU 部分执行，后者是在 GPU 部分执行。

具体的 CUDA 程序执行过程如下：

1. host 端程序先将待处理数据传递进显存

2. GPU 执行 device 端程序

3. host 端程序将结果从显存取回

如下图所示：

回到顶部

CUDA thread 架构

　　thread 架构分成三个等级：

　　1. 执行的最小单元是 thread

　　2. 多个 thread 可以组成一个 block，block 中的 thread 可并行执行且可存取同一块共享的显存。但要注意的是每个 block 中的 thread 是有数量限制的。

　　3. 多个 block 可以组成一个 grid，但 grid 中的 block 无法共享显存( 只能共享些别的信息 )，因此可合作度并不高。

　　如下图所示：

回到顶部

CUDA 程序执行模式

1. CUDA 程序利用并行化来替代内存 cache，即一个 thread 需要等待内存则 GPU 会切换到另一个 thread 执行。

2. CUDA 程序对于 "分支预处理" 的实现也是采用和 1 类似的方式。

回到顶部

小结

本文旨在对CUDA并行编程技术做一个感性而总体的介绍，该系列后续文章将具体讲解CUDA编程技术。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Tiger-Li CSDN认证博客专家 CSDN认证企业博客

码龄14年

75: 原创

2万+: 周排名

70万+: 总排名

441万+: 访问

: 等级

2万+: 积分

1159: 粉丝

1807: 获赞

214: 评论

7651: 收藏

私信

关注

热门文章

分类专栏

最新评论

直方图均衡化
starman584: 找的就是这个图片推导，别的不说，这个才是精华
定点数的表示方法
做而论道_CS: 补码提出来不就是为了方... －－－－－－－－－补码，就是用来唬你的。补码，实际上，就是正常的数字！计算机中，根本就没有补码。（更没有原码反码了）。你失去了正常的概念，已经走火入魔了。你是被人忽悠瘸了，手表，都看不懂了。
定点数的表示方法
cwxia0s: 根源是舍弃进位不假，然后呢，是为了解决什么问题，还不是加法当加法器用，补码提出来不就是为了方便的处理负数吗，不管取反加一也好，加一个周期也好，不管怎么看，总要实现出来，上升到思维的高度，小心走火入魔
定点数的表示方法
cwxia0s: 引用你自己博客写的： ``` 为什么要使用补码呢？补码，究竟是什么东西呢？其实，补码，就是一个【代替负数进行运算的正数】。有了补码，负数，就成了正数，减法运算，也就转成了加法运算。因此，加、减法，就都可以统一用加法运算。这么一来，计算机的硬件，就可以得到简化。 ``` 补码的意义再说，你看看你说的什么东西： ``` 舍弃进位，加法可以当减法，这是小朋友都能看懂的知识。计算机专家，为什么要编造符号位原码反码 ...，这些虚假的故事呢？因为，这些专家，小学都没有毕业！ ``` ``` 是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。 ``` 补码的意义是在实际中，简化电路设计，引入这种计算方式，这就是在电路设计背景下提出的，有错吗你的理解能力，素质，都堪忧，别回复我了，看你的言论就晦气
定点数的表示方法
做而论道_CS: 补码的计算是在电路设计的背景下引入的－－－－－－－－－你说的，不对啊！是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。是理论，指导实践。你这思维方式，还能搞个蛋的技术，真就不错了。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。