Tesla 和 GeForce 之间的区别

Tesla 和 GeForce 之间的区别

对于消费级用户来说, GPU 就是玩游戏。对于专业人员来说, GPU 是计算工具。
NVIDIA 针对消费级用户设计 GeForce 系列产品, 针对专业领域企业级用户设计 Tesla 和 Quadro 系列产品。
俗话说一分钱一分货、贵有贵的道理,Tesla 和 GeForce 之间的区别有哪 些?

● 64-bit 双精度浮点运算
对于消费级用户来说 GPU 的浮点运算能力可以忽略不计, 因为日常应用根本涉及不到。所 以追求性价比的消费级用户, 不会为没用的高双精度浮点运算能力买单。
而对于专业领域来说,准确性是计算结果的重要指标,双精度浮点运算能力直接影响计算准 确性和时效性。
例如最新的专业用卡 Tesla P100 和最新的桌面级用卡 GeForce GTX 1080, 双精度浮点元算 能力相差约 17 倍。

● 错误侦测与修正 术业有专攻
GPU 计算的结果是否正确,如果出错是否修正,这个问题在 GeForce 产品和 Tesla 产品上有 很大差异。
GeForce 产品对于计算精度要求相比于 Tesla 要低很多, 也许对于普通用户来说既是发现一 些数据瑕疵也会忽略不计(例如显存错误) 。同时 GeForce GPU 对于数据修正能力上来说也 比较欠缺。
反观 Tesla 产品, 由于是应用于专业领域, 对数据准确性和及时错误数据修正能力都非常依 赖。例如 Tesla GPU 能够修正 Single -bit 错误并侦测和警告 Double-bit 错误。在最新的 Tesla P100 GPU 中, ECC 支持包含 HBM2 显存、注册文件、共享内存、L1 缓存和 L2 缓存。

● 质保
NVIDIA 关于 GeForce GPU 产品的质保明确声明, GeForce 产品并不是为服务器设计。如果
GeForce GPU 运行在服务器中将失去应有质保。下面是 NVIDIA 厂商质保相关页面 : 保证产品被用于消费级终端用户, 而不会用于数据中心、GPU 集群等商业用途, 否则将失去质保。

● GPU 显存性能
密集型计算应用需要高性能计算单元,同时高速访问数据也非常重要。在很多 HPC 应用中, 简单的提升 HPC 计算性能实际计算效率并不明显, 除非显存性能也同时提升。基于这个原 因, Tesla GPU 提供了比 GeForce GPU 更好的性能, 例如最新的专业产品 Tesla P100 16GB 带宽 732GB/s, 最新的桌面级产品 GeForce GTX 1080 带宽仅为 320GB/s。

除了核心规格外, 显存规格将是GPU 发挥性能的第二重要因素。
首先最新的 Tesla P100 搭配片上 HBM2 显存 ;其次显存容量 12GB 起步, 还有 16GB 产品 可选;再次 Tesla Pascal 产品支持多 GPU 显存共享技术。
无论是在显存容量、显存频率上 GeForce 产品都无法和 Tesla、Quadro 产品相提并论。
● PCI-E vs NVLink 十倍性能差距
在多处理器,数据共享传输决定了整体集群性能发挥。GeForce 产品仅支持 PCI-Express 通 道,峰值吞吐量 16GB/s, 而 Tesla 和 Quadro 支持 NVLink 通道单向峰值传输 80GB/s, 双 向峰值吞吐量达 160GB/s。
● 一样的半导体 不一样的软件待遇
专业应用需要专业软件的搭配, 而针对专业领域量身定制的 Tesla 和 Quadro, 在 NVIDIA 和软件开发商会合作下能够实现有针对性的GPU 加速优化, 而 GeForce 不会得到这样的待 遇, 即使最顶级的 GeForce 产品。
● 操作系统支持
虽然 NVIDIA 的 GPU 驱动非常灵活、支持度高,但在系统支持方面还是有差别。GeForce GPU 仅支持 Windows 7、Windows 8 和 Windows 10。而 Windows 服务器更适合 Tesla 系列产品
和 Quadro 系列产品, 而且支持完备、驱动完善。
当然, 所有 NVIDIA GPU 均支持 Linux 系统。
● 产品生命周期
由于消费级 GPU 市场的性质所定, GeForce 产品生命周期一般较短。而在专业项目需求中 一般都会有一个较长的使用周期( 比如一些更新需求需要三年以上) 推荐使用专业 GPU。
NVIDIA 的 Tesla 和 Quadro 产品会有很长的生命周期和支持服务。此外, 企业级 GPU 会经 过更专业的测试和严格的品控生产环节获得。
● 功耗效能
GeForce GPU 是定位于消费级游戏产品, 通常不会针对功耗效能做设计。与此相反, Tesla GPU 是被设计应用在大规模调度的集群中,所以功耗效能尤为重要。这使得 Tesla GPU 成为 大规模集群搭建的更佳选择。例如 Tesla P40 和 GeForce Titan X 在性能相当前提下,前者还 能提供双倍显存以及更低功耗、更低发热量。

● 赢在起跑线 DMA 引擎
DMA 全称 Direct Memory Access, 译为直接存储器存取, 它能够实现系统内存和 GPU 显存 之间的高速数据传输,它对 GPU 加速来说尤为重要。低速传输会导致 GPU 核心闲置直到数 据抵达 GPU 显存中。同样的, GPU 的数据结果由于低速传输返回也会导致 CPU 闲置。
GeForce 产品只能提供单 DMA 引擎,而 Tesla GPU 产品的双 DMA 引擎可以大大缓解数据交 换效率瓶颈。数据可以同时从 GPU 传出和传入。
● 化繁为简 GPU Direct RDMA
在 CUDA 的 8.0 版本中, NVIDIA 已经包含异步 GPU-Direct RDMA 技术, 其能够实现 GPU 发起 RMDA 传输无需 CPU 干预。
GeForce GPU 不支持 GPU-Direct RDMA, 而 Tesla GPU 不仅全面支持 GPU -Direct RDMA, 还支持各种其它 GPU-Direct 功能, 因此更适用于企业级应用领域并且能禁得起考验。
● Hyper-Q 并行处理中的并行处理

Hyper-Q 能够令 MPI 和 CUDA 流允许多 CPU 线程或进程利用一颗 GPU。这对现有的 MPI 并行计算非常重要, 因为很多代码已经针对多核 CPU 做过优化设计。允许 GPU 接受每个 MPI 线程运行在系统上可以提供潜在的更高性能提升。它还能降低一个应用中的源代码数据 重组量。
而且,对于 GeForce GPU 来说 CUDA 流是 Hyper-Q 的唯一形式, 其允许 GeForce 在单独的 CPU 核中高效的接受和运行并行计算。
● GPU 健康监控和管理天壤之别
对于 GeForce 用户来说,能够看频率、风扇转速然后可以调节频率已经满足所有所需。但是 对于专业领域来说, 尤其是集群管理时, GPU 监控需要更全面、管理更深入。
Tesla GPU 支持 NVML/NVIDIA SMI、OOB、InfoROM、NVHealthmon、TCC 和 ECC。
● GPU Boost 功耗是把双刃剑
NVIDIA 目前所受所有 GPU 均支持 GPU Boost, 但是对于 Tesla 和 GeForce 两条产品线而言 却有不同用途。
GeForce GPU Boost 会在 TDP 允许条件下向性能妥协,频率会自动调节浮动。低负载需求就 降低频率和电压, 高负载需求就提升频率和电压, 同时还会有高噪音并发症。
Tesla GPU Boost 则是在 TDP 条件允许下以稳定性为重, 系统管理者可以根据性能需求设定 最佳频率后锁定, 同时为了保证整个 GPU 集群的性能匹配和稳定性,集群内所有GPU 会同 步该频率并锁定。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值