5_计算显卡对比(20190103- )


显卡巨头Nvidia公司的产品可以分为三大类:科学计算卡(Tesla)、专业图形卡(Quadro)和家用显卡(Geforce)类。可是同样都是显卡,为什么Geforce卡只需要几千块,而Tesla计算卡能卖到5-6万呢?
在这里插入图片描述


1、科学计算显卡的几个主要性能指标

1、运算能力:FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算;
2、计算性能: 
3、显存大小:显存大小也决定了实验中能够使用的样本数量和模型复杂度。
4. cuda 核心数量

2、性能指标比较

1、CUDA compute capability对比(computer capability 并不代表显卡的计算能力,主版本号说明GPU的架构,副版本号相当于更新的版本)
GTX Titan x :5.2
GTX 980 :5.2
 Tesla P100 :
Tesla K80 :3.7
Tesla K40 :3.5
K4200 : 3.0

2、计算性能(TFLOPS) 比较
单精度single 双精度double

GTX Titan x :     7                            0.2 
GTX 980      :      4.6                        0.15
  Tesla P100 :      10.6                     5.3
Tesla K80    :      8.73                      2.91 
Tesla K40    :      4.29                      1.43
K4200         :       2.0

单精度能够保证小数点后6到7位计算准确(2^23),双精度则是14到15位(2^52)

3、显存大小

GTX Titan x :12Gb
GTX 980      :4Gb
 Tesla P100 :  16G
Tesla K80    :24Gb
Tesla K40    :12Gb
K4200         :4Gb

4、cuda 核心数量
GTX Titan x
GTX 980
Tesla P100 : 3584
Tesla K80 : 4992
Tesla K40 : 2880
K4200

5、价格比较(网上商城京东淘宝报价)
GTX Titan x :8000±
GTX 980 :6000±
Tesla P100 : 45000++
Tesla K80 :33000±
Tesla K40 :25000±
K4200 :6000±


3、优缺点

1、GTX 系列显卡优缺点:

优点:单精度计算能力强大,显存最大12Gb,性价比高

缺点:双精度计算能力弱,没有计算纠错ECC 内存,对于超高精度计算不利

2、Tesla 或 quadro显卡优缺点:
优点:双精度计算能力最强,拥有ECC内存增强计算准确率,

缺点:单精度计算能力差,价格较高

总结:单从性能上选择,Tesla K80是最强大的,但也最贵;综合性价比来考虑 GTX Titan X 最好。

4、FP64双精度浮点计算能力强(参考

对于专业卡而言,仅强调FP32单精度运算速度是不够的,毕竟进行生化模拟,比如化学分析和生物遗传学对数学精度的要求远远高于图形成像要求。举个例子吧,要展示一个清晰的图像,我们使用能计算到小数点后23位的Geforce卡能满足(你能看出两张2K分辨率图片中几个像素点的不同吗?)。但是对于科学家而言,小数点后23位可能会产生误差,这种误差可能导致药物研发/航空探索等科学研究出现重大失误。这时就需要双精度(FP64=52位小数)进行更加精准的计算。下图为不同显卡的双精度浮点运算能力:

在这里插入图片描述

小数点后的小数越多,误差越小,读数越精确,这是我们从小学就知道的基本数学常识。
在这里插入图片描述

5、FP16半精度计算能力强

如果说上面的双精度做的是“数学题”,要求答案越精准越好,那么半精度计算就是做“选择题”,只要求答案“YES or NO”。半精度浮点计算通常应用于深度学习/人工智能应用中,NV官方曾经对某CSDN博主提问“为何1070半精度运算比单精度慢”做出回答:同样是帕斯卡架构,只有P100完整核心的拥有完整的计算速度。下图是不同架构中半精度、单精度和双精度吞吐量对比,6.0代表帕斯卡架构完整核心,7.0代表最新的volta架构完整核心。从图中可以看出不同架构中完整核心都是支持所有精度计算模式的。
在这里插入图片描述

可是这和价格贵有什么关系呢?

  1. 核心完整程度不同

上文提到的FP64和FP16,一个要求在SM单元中专门安置FP64单元进行双精度计算,效果仅有FP16的1/8不到,普通Geforce卡的GPU并没有独立FP64单元,被民间称为“阉割版”,所以拥有完整计算能力的专业卡GPU价格昂贵;FP16则不需要独立单元参与,这里不提。商品功能越多,附加值越高,这一点很好理解吧。
在这里插入图片描述
上图是最近热门的Nvidia Volta核心SM单元结构图,可以看到一个SM单元不仅保留了FP32/FP16混合计算,还支持IN8与FP64甚至单独的Tensor,这样一张Volta完整核心的Tesla计算卡可以胜任半精度(AI/深度学习)、单精度(普通影音处理)和双精度(生化物理研究模拟等)甚至120T的Tensor多重计算任务。

  1. 颗粒不同

另外,为了支持高精度计算不会在读写存储时出现误差,Tesla通常都采用了带ECC纠错能力的HBM2显存,这种显存产量低价格昂贵,这也构成了Tesla计算卡价格昂贵的原因之一。选择不具备ECC内存纠错功能的GPU卡进行高精度计算会如何?2018年年初一些研究人员发现用Titan V卡进行仿真计算时会输出不准确的答案,这就是因为Nvidia TITAN系列显卡禁用了HBM颗粒的ECC功能导致数据出现误差的,英伟达官方也建议:在进行高精度科学计算时应该采用专业的Tesla显卡。
在这里插入图片描述

  1. 市场需求

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
计算机硬件市场调查报告 通常所有的计算机的硬件系统通常包括五大件即为:输入设备、输出设备、储存器、 控制器和运算器。 本次调研的目的就是获取电脑硬件的市场价格行情. 我们最先了解的就是主机三大件的情况,业内通常说的三大件指的就是:CPU、内存、 硬盘。 CPU:电脑的核心中央处理器,处理器性能的好坏关系到整机的运行速度,CPU从最初发 展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:四位 微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器 等等。据此CPU主要是由两大厂商制造AMD和intel对于这种高精密度的硬件市场上基本没 有存在所谓的"山寨"CPU。店家基本上都会对客户配置INTEL厂商的CPU,经过了解发现了 其中的缘由,AMD的CPU适合超频玩家使用。为游戏玩家提供了一个很好的自主发挥的平 台。Intel的CPU一贯是以稳定性著称,给用户带来长久稳定的使用。Intel的CPU目前在 市场上占据主导地位。下面列举些近期市场上主要的CPU市场行情: Intel: CPU型号 主频(Ghz) 价格 I3-2120双核心 四线程 3.3 730 I5-2500k四核心 四线程 3.3 1370 I7-2700k四核心 八线程 3.5 2120 AMD: A10-5800K 四核心 3.8 850 羿龙II X6 1055T 2.8 970 FX 8150 八核心 3.6 130 硬盘经历IDE转变为现在大家广为使用的SATA速度上有了极大的提升,sata的硬盘先 进我们通常使用的容量为500G或者1T,按理来说SATA的已经出来有些时候了但是近期硬 盘的价格上下浮动不定。给现在准备出手装配电脑的用户带来困惑,价格涨了一倍是该 出手配呢还是缓缓再出手呢?硬盘的厂商主要是有西部数据和希捷这两大厂商,除了这 2个还有很多生产硬盘的厂商,如东芝,三星,威刚等,下面列举两大厂商不同容量的价 格: 西部数据(WD) 容量(GB) 缓存(MB) 价格 500 16 335 500 32 580 1(TB) 32 450 1(TB) 64 640 希捷(seagate) 500 32 480 1(TB) 32 650 经过对比发现两大厂商间硬盘的价格相差不大,硬盘的该买参数除了看容量之外 一个重要的还有缓存的大小缓存越大越好。 内存价格也会因为厂商的原因而大幅变动,内存主要有金士顿、威刚、三星、南亚易 胜、金泰克、现代等电脑城主要的还是以金士顿为主,但是金士顿的由于牌子做得非常 大内存市面上存在很多的假货冒仿,推荐购买非金士顿的内存,内存其实都差不多只是 封装的外观不一样所以只要不要买到假货冒牌的就可以了其他的大牌子也是可以作为选 择的,下面列出通过调查的pc机金士顿内存的几种型号及价格: 金士顿内存: 型号介绍 运行频率(MHZ) 容量(G) 价格 主流的3代机子 DDR3 1600 4 130 DDR3 1333 4 125 DDR3 1333 2 70 当然市面上现在还存在着一些DDR和DDR2内存的机子即商家们常说的一代和二代机, 即将面临淘汰,目前主流的是频率为1333(DDR3)的3代机子。内存的价格是越"早产"的 价格会越高,原因更新换代之后由于厂商停产从而导致供不应求价格上涨。 主板: 主板的选购也是极其重要的,主板的主要几家厂商有华硕、技嘉、微星、映泰、昂达 等同学在配置主板的时候要根据CPU型号进行配置然后要注意主板的芯片类型高端的CPU 尽量配置一线的主板比如华硕技嘉就是不错的牌子主板稳定性能突出值得推荐。 主板的价格从低到高,各档次的价格都有,低至三四百,高至一二千不等。 电源: 电源是一个比较关键的电脑城店家给我推荐电源的时候都要问我机子是不是有显卡的 玩不玩大型游戏的,调查发现电源很多杂牌上标的功率都是虚的,应该选用大品牌比如 航嘉、长城、大水牛等这样的就不错电源稳定机子性能才可以得到发挥。 其他配件: 显示器、机箱、键鼠、音箱、显示器、光驱(非必须) 这些配件对电脑机子整体性能没有太大的影响,关键看自己选择,一个原则选购电脑 时不要一心只想便宜,要相信品牌的力量,品牌是品质的保证。至于其他的硬件经过调 研搞清楚了自己的需求才能配到适合自己用的电脑。 ----------------------- 计算机硬件市场调研报告全文共4页,当前为第1页。 计算机硬件市场调研报告全文共4页,当前为第2页。 计算机硬件市场调研报告全文共4页,当前为第3页。 计算机硬件市场调研报告全文共4页,当前为第4页。 ----------------------- 4

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值