显卡性能总结-持续更新

算力计算:

算力的计算方式-CPU算力

CPU算力计算公式:
Flops=【CPU核数】x【单核主频】x【CPU单个周期浮点计算能力】

FP64双精度:CPU单周期双精度浮点计算能力= 2(FMA单元数)*2(M/A同时计算乘法和加法)*512bit(指令长度)/64bit=32

FP32单精度:CPU单周期单精度浮点计算能力=2(FMA单元数)*2(M/A同时计算乘法和加法)*512bit(指令长度)/32bit=64

以英特尔6348 CPU(即:英特尔® 至强® Gold 6348处理器,28c,2.60 GHz)为例,支持AVX512指令集,且FMA系数=2

算力的计算方式-GPU算力

GPU的算力也是用FLOPS(浮点运算每秒)衡量。但是GPU 算力跟计算核心个数、核心频率、核心单时钟周期能力三个因素有关。

计算方式:峰值计算法

通过GPU 峰值计算能力(峰值算力)计算,计算公式如下:
在这里插入图片描述

Fclk 为 GPU 的时钟周期内指令执行数 (单位为 FLOPS/Cycle), Freq 为运行频率 (单位为 GHz), NSM 为 GPU SM 数量 (单位为 Cores)。

以英伟达A100 GPU卡为例
在这里插入图片描述

NVIDIA A100 单精度FP32指令吞吐 64 FLOPS/Cycle ,核心运行频率为 1.41GHz ,SM 数量为108 ,Tensor Core里面的是融合乘加指令,所以一次指令执行会计算2次(一次乘法一次加法),因此会乘以2。
那么根据上面的公式有:
A100的峰值算力=1.41x10’9x108x64x2/10^12=19.491 TFLOPS
因此 GPU 的算力峰值是,19.491 TFLOPS,大约为 19.5 TFLOPS

显卡概念

显卡(Graphics Processing Unit,简称GPU)是计算机中用于处理图形相关运算的硬件设备,是现代计算机中不可或缺的重要组成部分。显卡的核心任务是生成计算机显示器上的图像,同时还广泛应用于人工智能、大数据计算和区块链等领域。

算力通常是运算能力,用于评价显卡等设备的性能。

TFLOPS:TFLOPS专指每秒可执行的万亿次浮点运算,专注于浮点运算的性能。

需要注意TFLOPS与TFLOPs的不同:

FLOPS:(Floating-point operations per second)的简称,每秒执行1万亿次浮点运算次数。比如NVIDIA的RTX4090单卡算力是82.58TFLOPS(FP32);

FLOPs:(Floating point operations)缩写,末尾的s表复数,意指浮点运算数,理解为计算量, 主要用来衡量算法/模型的复杂度,比如YOLOv11n模型的FLOPs大概为6.4x10^9。

显卡种类

显卡的优势主要体现在其强大的并行计算能力,能够高效处理大量的矩阵运算,这对于深度学习中的大规模神经网络训练至关重要。与传统的CPU相比,GPU具有更多的核心,能够同时处理更多的计算任务,这使得它在图像识别、自然语言处理等任务中表现出色。尤其是在训练大模型时,GPU能够显著缩短计算时间,提升训练效率。显卡目前有四类。

集成显卡/核心显卡

集成在 CPU 内部或主板上的显卡。
性能较低,适合基本的图形处理任务,如办公和视频播放。低成本、低功耗。
代表产品:Intel Iris Graphics、AMD Radeon Vega。

独立显卡

独立的硬件设备,通过 PCIe 插槽连接主板。
性能强大,适合游戏、视频编辑和高性能计算。
代表产品:NVIDIA GeForce、AMD Radeon。

专业显卡

针对特定行业设计,用于 CAD、3D 渲染、视频制作和科学计算。
优化了双精度计算性能和稳定性。
代表产品:NVIDIA Quadro、AMD Radeon Pro。

移动显卡

用于笔记本电脑,设计更加紧凑,功耗低。
性能略低于台式机显卡,但提供便携性。

显卡排行榜

显卡界,有两家公司占据绝对主导地位:英伟达(NVIDIA俗称N卡)和AMD(俗称A卡)。
在深度学习训练中,最常用的显卡品牌是 NVIDIA ,提供了专门为深度学习优化的硬件和软件支持。
以下是摘自公众号排行榜信息
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
以上是google cloud的GPU参数介绍,P100有媲美T4的单精度运算能力,但半精度依旧比较低。

以下是国产机参数
在这里插入图片描述

参考链接

https://mp.weixin.qq.com/s/ZN2xAzWELQ7TYrovyFTI0A
http://mp.weixin.qq.com/s?__biz=MzkxODcwNTAyMA==&mid=2247483801&idx=3&sn=e9f5d05165745ac29d815383d97f4fb8&chksm=c007114f12a2eac44dd027dc548b218f7ce2998bfa747853b292b85fb293648b216ee90ac95d&mpshare=1&scene=24&srcid=0109TZlIJMkn8GcyDwGIPfyQ&sharer_shareinfo=adb57898da832fe54fddf6b86c9edbd4&sharer_shareinfo_first=adb57898da832fe54fddf6b86c9edbd4#rd

http://mp.weixin.qq.com/s?__biz=Mzk1NzQyODAzMQ==&mid=2247483683&idx=1&sn=19eb6c99e2f177847c28047ba57ca79a&chksm=c21b8d1088b775b8f59d37cd9488edcdad3b7a9bfd31ac8d77d84c5dcd72e6e6a6f6d957b715&mpshare=1&scene=24&srcid=01095qojEkDtZ3SCmkPrhzZR&sharer_shareinfo=e8e7eda1ce5c76f208625369a4424e92&sharer_shareinfo_first=e8e7eda1ce5c76f208625369a4424e92#rd

http://mp.weixin.qq.com/s?__biz=Mzg5MTAwNzE3OQ==&mid=2247483994&idx=1&sn=319c83e8e8cc1095fe5c0cfc8fcdf5a2&chksm=ce90184ceaf179d8db0ce1445fc5e5fa0c0fe3dcb6ab227af5b84769e094602bf3767dfdcb56&mpshare=1&scene=24&srcid=0109ZHlu8f0TXPqpOBzGb2lg&sharer_shareinfo=bd50dd4c58f520ef9c5ccbbadf0ba35a&sharer_shareinfo_first=bd50dd4c58f520ef9c5ccbbadf0ba35a#rd

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

河南-殷志强

希望我的文章能帮助到你

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值