2020 年深度学习最佳 GPU 一览,这篇 GPU 最全攻略请查收!

image

深度学习模型越来越强大的同时,也占用了更多的内存空间,但是许多GPU却并没有足够的VRAM来训练它们。

那么如果你准备进入深度学习,什么样的GPU才是最合适的呢?下面列出了一些适合进行深度学习模型训练的GPU,并将它们进行了横向比较,一起来看看吧!

太长不看版

截至2020年2月,以下GPU可以训练所有当今语言和图像模型:

  • RTX 8000:48GB VRAM,约5500美元
  • RTX 6000:24GB VRAM,约4000美元
  • Titan RTX:24GB VRAM,约2500美元

以下GPU可以训练大多数(但不是全部)模型:

  • RTX 2080 Ti:11GB VRAM,约1150美元
  • GTX 1080 Ti:11GB VRAM,返厂翻新机约800美元
  • RTX 2080:8GB VRAM,约720美元
  • RTX 2070:8GB VRAM,约500美元

以下GPU不适合用于训练现在模型:

  • RTX 2060:6GB VRAM,约359美元。

在这个GPU上进行训练需要相对较小的batch size,模型的分布近似会受到影响,从而模型精度可能会较低。图像模型内存不足之前的最大批处理大小:image

*表示GPU没有足够的内存来运行模型。性能(以每秒处理的图像为单位):image

*表示GPU没有足够的内存来运行模型。语言模型内存不足之前的最大批处理大小:image

*表示GPU没有足够的内存来运行模型。性能:image

  • GPU没有足够的内存来运行模型。使用Quadro RTX 8000结果进行标准化后的表现图像模型image

语言模型image

结论:
  • 语言模型比图像模型受益于更大的GPU内存。 注意右图的曲线比左图更陡。这表明语言模型受内存大小限制更大,而图像模型受计算力限制更大。
  • 具有较大VRAM的GPU具有更好的性能,因为使用较大的批处理大小有助于使CUDA内核饱和。
  • 具有更高VRAM的GPU可按比例实现更大的批处理大小。 只懂小学数学的人都知道这很合理:拥有24 GB VRAM的GPU可以比具有8 GB VRAM的GPU容纳3倍大的批次。
  • 比起其他模型来说,长序列语言模型不成比例地占用大量的内存,因为注意力(attention)是序列长度的二次项。

GPU购买建议

  • RTX 2060(6 GB):你想在业余时间探索深度学习。
  • RTX 2070或2080(8 GB):你在认真研究深度学习,但GPU预算只有600-800美元。8 GB的VRAM适用于大多数模型。
  • RTX 2080 Ti(11 GB):你在认真研究深度学习并且您的GPU预算约为1,200美元。RTX 2080 Ti比RTX 2080快大约40%。
  • Titan RTX和Quadro RTX 6000(24 GB):你正在广泛使用现代模型,但却没有足够买下RTX 8000的预算。
  • Quadro RTX 8000(48 GB):你要么是想投资未来,要么是在研究2020年最新最酷炫的模型。

附注图像模型:
image

语言模型:
image

来自Tim Dettmers的成本效益评测

https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/image

卷积网络(CNN),递归网络(RNN)和transformer的归一化性能/成本数(越高越好)。RTX 2060的成本效率是Tesla V100的5倍以上。对于长度小于100的短序列,Word RNN表示biLSTM。使用PyTorch 1.0.1和CUDA 10进行基准测试。

从这些数据可以看出,RTX 2060比RTX 2070,RTX 2080或RTX 2080 Ti具有更高的成本效益。原因是使用Tensor Cores进行16位计算的能力比仅仅拥有更多Tensor Cores内核要有价值得多。

来自Tim Dettmers的建议:
  • 总体最佳GPU:RTX 2070 GPU
  • 避免使用 :任何Tesla;任何Quadro;任何Founders Edition;Titan RTX,Titan V,Titan XP
  • 高效但价格昂贵:RTX 2070
  • 高效且廉价:RTX 2060,GTX 1060(6GB)
  • 价格实惠:GTX 1060(6GB)
  • 价格低廉:GTX 1050 Ti(4GB)。或者:CPU(原型设计)+ AWS / TPU(培训);或Colab。
  • 适合Kaggle比赛:RTX 2070
  • 适合计算机视觉研究人员:GTX 2080 Ti,如果训练非常大的网络,建议使用RTX Titans
参考链接:
  1. https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
  2. https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/
  3. https://lambdalabs.com/blog/best-gpu-tensorflow-2080-ti-vs-v100-vs-titan-v-vs-1080-ti-benchmark/
  • 5
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值