英伟达的GPU(2)

本文介绍了英伟达GPU的CUDA架构,包括CUDA Core、Tensor Core、Special Function Units等组件,以及CUDA的编程模型,如Kernel、Grid、Block和Thread的三级线程管理。CUDA作为并行计算平台,提供了与GPU交互的接口,如CUDA Core用于向量化计算,Tensor Core支持张量运算。文章还提及了CUDA与深度学习库cuDNN的关系,以及CUDA编程的基本概念。
摘要由CSDN通过智能技术生成

书接上文

      上篇地址:英伟达的GPU(1) (qq.com)

      上文书,我们讲到NV GPU的SM,SM的组件

      

  • CUDA Core:向量运行单元 (FP32-FPU、FP64-DPU、INT32-ALU),这块最容易被混淆,CUDA Core来实现矩阵计算是用的向量化能力,直接矩阵对矩阵式用Tensor Core,这块后面会讲。另外,实际上Volta,也就是V100那个架构以后,因为FP32FPU和INT32ALU都是单独的独立出来了,所以严格说就没CUDA Core了,但是大家都这么叫也不改口了。

  • Tensor Core:Tensor也就是张量运算单元(FP8、FP16、BF16、TF32、INT8、INT4)

  • Special Function Units:特殊函数(超越函数和数学函数,反平方根、正余弦啥的)

  • Warp Schedule

  • 25
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值