CUDA并行计算框架编程+矩阵相乘并行计算

本文介绍了CUDA并行计算框架,详细阐述了CUDA的软件架构和线程层次结构,包括Kernel、Grid、Block和Thread。重点讨论了GPU硬件中的SM流式多处理器,并提到Block大小设置的建议。同时,提供了在Visual Studio中配置CUDA的参考链接,以及一个实现矩阵相乘并行计算的代码示例。
摘要由CSDN通过智能技术生成

当下的GPGPU(General Purpose GPU(Graphic Process Unit))—(CUDA: Compute Unified Device Architecture)即通用计算图形处理器。

安装过程可参考我的另一篇blog:https://blog.csdn.net/pnan222/article/details/79449923

CUDA软件架构:(1)开发库(CUDA Library)(2)运行时环境(CUDA Runtime)(3)驱动(CUDA Driver)

CUDA的线程层次结构:Kenel-->Grid-->Block-->Thread

GPU硬件的一个核心组件是SM(Streaming Multiprocessor)流式多处理器,SM可以并发地执行数百个线程,且一个block对应一个SM,而一个SM则可以对应多个block

grid只是逻辑层;而SM才是真正的物理层;block的大小一般要设置成32的倍数

在VS上的配置过程可参考blog:https://blog.csdn.net/kyocen/article/details/51424161

Code:

#include <iostream>  
#include <assert.h>
#include <time.h>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值