【CUDA 1】CUDA编程基础概念知识

Augustus_WY

已于 2023-08-18 14:35:31 修改

阅读量264

点赞数

分类专栏： CUDA 文章标签： c++

于 2023-07-25 21:17:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Augustus_WY/article/details/131813080

版权

CUDA是NVIDIA提供的并行计算平台，用于利用GPU进行高效计算。文章介绍了CUDA的编程模型，包括并行运算的概念、GPU的网格-块-线程架构以及CUDA的Runtime和DriverAPI。CUDA编程涉及将计算任务分解为核函数，在GPU上分配存储，传输数据，并调用内核执行。RuntimeAPI是较为高级且方便的选择，适合多数开发场景。

摘要由CSDN通过智能技术生成

【CUDA 1】CUDA编程基础概念知识

相关博客
【CUDA 0】CUDA编程环境安装及配置

目录

【CUDA 1】CUDA编程基础概念知识
前言
一、并行运算
二、概念基础
- 1.简化架构
- 2.CUDA Runtime
参考

前言

CUDA是NVIDIA公司提出了一种通用的并行计算平台和编程模型，有人说CUDA是一门语言，也有人认为其是API。
但是其准确说应该是一套模型架构，其API也有着driver API 和 runtime API，而基于CUDA也有着Arrayfire这样的库，使用起来也更为简单。

一、并行运算

相对于串行计算的程序从上至下依次运行而言，并行计算可以一次同时执行多指令算法，在时间和空间上并发处理，可大幅度提高计算速度。因此在编程中，也多有通过thread进行多线程编程。而再好的CPU线程速都是有限的，不像GPU的核速和线程数更是丰富，像现在国内常用的显卡，例如4090，A800这些，只要划分合理、使用得当，不会遇到像CPU利用thread多线程编程，不够用这种情况。因此对CUDA编程有一定的掌握很有必要。

二、概念基础

1.简化架构

无论显卡费米、多普勒架构，还是现在Ada架构这些N卡历代架构的变化，显卡的内部结构就是网格(grid)–>块(block)–>线程(thread)

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。