AI架构设计3:GPU运算模型

GPU的运算模型

上一章节已经介绍了显卡的基本结构,由内存和计算单元SM组成。那么显卡的运算模型是什么样子?它如何将机器学习的任务转化为合适的运算指令?当然这里不针对Cuda编程展开细节的讨论,但是还是需要对它的运算模型有一定的了解。

计算模型中的线程(Thread)、线程块(Block)和线程网格(Grid)三个概念,分别对应着Cuda Core、SM和kernel三种不同维度的计算单元。一个内核(kernel)会启动多个线程块,这些线程块会在SM之间进行调度。分到任务的SM则将线程块的内部线程分配给具体的Cuda Core执行。

在计算模型中,所有线程都是并行执行的。一个线程块只能分配到一个SM上执行,同一个SM中的线程可以互相通讯。一个线程网格生成多个Block会被调度到多个SM

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值