英伟达GPU中的Tnesor Cores数量多寡与显卡性能有什么关联？

zoetu

已于 2023-02-18 19:20:43 修改

阅读量837

点赞数

分类专栏：知识碎片文章标签：深度学习机器学习人工智能

于 2023-02-18 19:16:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43800119/article/details/129103278

版权

知识碎片专栏收录该内容

59 篇文章

订阅专栏

前言

最近在调研常用显卡的参数，看到Nvidia Tensor Cores常用于其中作为对比，呈现在性能好的显卡比如A100比RTX 3060更多更全面，开始思考Tensor Cores细致的作用是什么？

英伟达GPU显卡的简要发展历程

GTX是英伟达过去显卡的型号，现在推出的以及高性能电脑使用的都是RTX系列的产品。其中RTX提供的一个新功能就是包含了Tensor Cores。

Tensor Cores作用

使用Tensor核(张量核)的两个CUDA库是cuBLAS和cuDNN。

cuBLAS使用张量核加速GEMM计算（GEMM是矩阵-矩阵乘法的BLAS术语）；
cuDNN使用张量核加速卷积和递归神经网络（RNNs）。

许多计算应用程序使用GEMM：信号处理、流体动力学等等。随着这些应用程序的数据大小呈指数级增长，这些应用程序需要在处理速度上进行匹配。图3中的混合精度GEMM性能图显示，张量核显然满足了这一需求。

提高卷积速度的需求同样巨大； 例如，深神经网络（DNNs）使用了许多层卷积。人工智能研究人员每年都在设计越来越深的神经网络；最深的神经网络中的卷积层现在有几十个。训练DNNs需要卷积层在正向和反向传播期间重复运行。

官网图片很明了地展示了张量核的作用：缩短推理时间、提升推理速度、推动高性能计算
在这里插入图片描述

参考资料

https://blog.csdn.net/quicmous/article/details/106617875
https://www.nvidia.com/zh-tw/data-center/tensor-cores/

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zoetu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。