CUDA并行计算——1.Introduction

Awesome Baron

已于 2023-06-27 12:02:11 修改

阅读量251

点赞数 1

分类专栏： CUDA并行计算文章标签： c++

于 2023-06-26 11:42:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46464899/article/details/131388152

版权

CUDA并行计算专栏收录该内容

6 篇文章 2 订阅

订阅专栏

这个系列是对CUDA并行计算课程的复习回顾，主要用作个人复习之用，难免有很多疏漏之处，错误的地方请在评论区指出，谢谢。

教材：Programming Massively Parallel Processors A Hands-On Approach 第3版

课程参照：伊利诺伊大学ECE408

下方是胡文美教授讲授ECE408的配套资源网页：Home Pagehttp://gputeachingkit.hwu.crhc.illinois.edu/

1.CPU与GPU区别

主要区别在于：

CPU(latency-oriented design)：面向延迟的设计
GPU(throughput-oriented design)：面向吞吐量的设计

总结：串行->CPU，并行->GPU

所以在后文将会提到一个概念：异构并行计算。

对于具有一个或很少线程的程序，具有较低操作延迟的CPU可以实现比GPU高得多的性能。当程序有大量线程时，具有更高执行吞吐量的GPU可以实现比CPU高得多的性能。

举例：

下图中将一个桃子视为一个应用程序，“桃子的核”指的是这个应用程序中sequential的代码，假如想要将并行计算应用于这些部分，就会像咬到桃子的核一样感觉不太好。这些部分往往很难并行化，但CPU非常擅长处理这些部分。好消息是，这些部分虽然占据了很大一部分代码，但往往只占应用程序执行时间的一小部分。

剩下的就是我们所说的“桃肉”部分，这些部分很容易并行化。CUDA编程模型旨在覆盖更大的桃子肉部分。在实际工程中，其实也是如此，我们的目标是找到能够并行的部分，再对能够并行的代码进行并行计算，而不是关注“桃子的核”部分能否并行实现。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。