随着AI人工智能的火热,GPU卡和GPU服务器市场的需求也持续攀升,服务器相关领域的朋友对GPU相关问题的讨论也越来越多。整理了常见的10个问题给大家做个分享。
- CPU和GPU芯片的对比
在计算机系统中,GPU(图形处理单元)与CPU(中央处理单元)是两个核心且不可或缺的概念,各自扮演着独特的角色,基于不同的架构和设计哲学。
CPU,作为计算机系统的中枢,是执行所有指令和协调各项任务的关键,所有运算和程序执行均需在CPU的指挥或参与下完成,堪称计算机的“大脑”。
GPU则专注于图形渲染及大规模并行计算,常被视作CPU的得力助手或加速引擎,也称为协处理器或加速计算单元。在现代计算环境中,无论是服务器、个人电脑、工作站、游戏主机,还是智能手机和平板电脑,GPU都扮演着至关重要的角色。
从架构组成的角度来看,尽管CPU与GPU都包含运算单元(ALU)、控制单元(Control)和缓存单元(Cache)这三大基本部分,但它们在资源分配上却存在显著差异。CPU的设计倾向于平衡,其中缓存单元占据约50%的资源,用于提高数据访问速度;控制单元和运算单元则各占约25%,确保指令的有效执行和计算能力的均衡。
而GPU则显著偏向于运算能力,其架构中运算单元的比例高达90%,用于支持大规模并行计算需求;相比之下,缓存单元和控制单元则分别仅占约5%,这样的设计使得GPU在处理图形渲染、视频编码解码以及科学计算等需要高强度并行处理的任务时,展现出远超CPU的性能优势。
二、GPU和显卡的区别
在日常的讨论与材料描述中,人们常常将GPU与显卡视为等同,这种简化的理解虽非全然错误,但从严谨的角度来看,两者之间确实存在微妙的区别。我们可以这样类比:GPU与显卡的关系,类似于CPU与主板之间的关系。GPU作为显卡的核心处理单元,扮演着显卡“心脏”的角色,正如CPU是主板上的运算与控制中心。
然而,显卡不仅仅局限于GPU这一核心部件。它还集成了诸如显存(用于存储图形数据)、供电系统(确保稳定运行所需电力)、稳压模块(保持电压稳定)、总线接口(实现数据传输)、散热风扇(控制温度)以及各类外围设备接口(如HDMI、DisplayPort等,用于连接显示器)等关键组件。这些组件共同协作,使得显卡能够完成从接收指令、处理图形数据到最终输出图像的一系列复杂任务。因此,虽然GPU是显卡功能实现的核心,但显卡本身是一个包含多个部件的完整系统。
三、GPU和GPGPU的区别
随着人工智能技术日新月异的进步,CPU的通用计算能力需求与图形算力需求并驾齐驱,持续攀升。在此背景下,GPGPU(全称General Purpose GPU,即通用计算图形处理器)应运而生。其“GP”前缀意味着它专为通用计算设计,可视为GPU在计算能力上的高度专业化形态,专注于非图形任务的快速处理。
GPGPU的架构设计经过精心优化,摒弃了传统GPU中的图形处理单元,而保留了其强大的SIMT架构和通用计算单元。这一创新使得GPGPU在高性能并行计算领域大放异彩,不仅支持更高级的编程语言,更在性能、易用性和通用性上实现了质的飞跃。当前市场上,如A800、H800、昇腾910B、海光DUC等主流产品,均属于GPGPU的杰出代表,正引领着计算技术的新潮流。
四、GPU分类:消费卡、专业卡和数据中心卡
NVIDIA的显卡目前可以按照应用领域大致分为三种类型:
- GeForce消费卡:面向游戏娱乐领域:如GeForce RTX™ 4090、GeForce RTX™ 3090等。
- Quadro专业卡:面向专业设计和虚拟化领域:如NVIDIA RTX™ A6000、NVIDIA® T1000等。
- Tesla数据中心卡:面向深度学习、人工智能和高性能计算领域:如NVIDIA H800\A800 Tensor Core GPU等。
市场定位不同,服务器大厂是不公开卖消费卡的。
三个分类在英伟达官网的截图实例如下:
五、涡轮卡和风扇卡的区别
做服务器的朋友都知道,目前GPU服务器通常要求显卡是涡轮的,到底和风扇的有啥区别呢?英伟达20系列显卡之前,公版显卡一直是采用涡轮散热器的,不管是AMD还是英伟达,公版显卡全部都是采用涡轮散热器,20系列以后显卡,风扇版显卡开始推广开来。
1、涡轮版显卡又称涡轮散热器显卡。
特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
2、涡轮版显卡又称涡轮散热器显卡。
特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
六、显卡的公版和非公版
公版显卡就是英伟达(NVIDIA)与AMD官方售卖的显卡,非公版就是各大厂品牌商购买GPU芯片后自己组装的显卡,个人消费市场一般比较多的就是非公版显卡。
公版显卡特点:
没有花里胡哨的设计,而且公版显卡不是每个芯片都会推出,有些显卡芯片只有公版参数,但没有推出公版显卡。
非公版显卡特点:
非公版显卡由其他显卡生产商基于官方芯片生产,比如华硕、七彩虹、微星、影驰等品牌显卡,
非公版显卡除了外观更为吸引眼球,主要差异还在于频率和一些散热设计。有一些非公版显卡,它们的频率超越了公版标准。这类显卡在同等级别的产品中,用料和设计都更高端,特别是在散热方面,厂商往往下足了功夫,大概分为顶级非公、普通非公、改版非公。
七、PCIE和SXM接口的卡
随着NVLink整机的火爆,英伟达的SXM(Scalable eXtensible Module)接口卡也被大家熟知,到底和标准的PCIe 接口卡有何区别,主要在设计理念、应用场景以及性能特点上的总结如下:
对比项 | SXM卡 | PCIE卡 |
接口类型 | SXM是NVIDIA的高端GPU的专用接口。 | 计算机系统的通用接口,通用性强,更灵活。 |
互联速率 | 使用NVLink技术实现GPU之间的高速连接,支持多GPU直接互联, | 受限于PCIe的版本和协议速率,远低于SXM NVLink的互联速率。 |
供电与冷却 | SXM接口支持供电,无需外部电源线,可采用更高效的冷却选项,支持TDP更高 | 受限于PCIe槽位供电和服务器主板的供电,TDP要低于SXM卡 |
维护性 | 英伟达一体化设计,八卡一体,往往故障维护不灵活 | 出现问题时,维护门槛低 |
八、英伟达HGX和DGX等
九、 Nvlink 和Nv Switch
1、Nvlink是一种互联技术,也指通信的链路。
2、Nv Switch是基于Nvlink技术的芯片或者设备。
3、在服务器内部NvSwitch就是芯片,跨服务器互联就是搭载芯片的Nv switch设备。
十、以A800、H800阉割前后参数对比
为了合规,A800相对比较厚道,仅限制了GPU之间的互联带宽,从A100的600GB/s降至400GB/s,算力参数无变化。H800则对算力和带宽都进行大幅调整,尤其是HPC领域相关的双精度算力(FP64)几乎归零。