2020 年深度学习最佳 GPU 一览，这篇 GPU 最全攻略请查收！

Mr.Jk.Zhang

于 2020-03-23 18:30:35 发布

阅读量5.3k

点赞数 5

分类专栏：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mrjkzhangma/article/details/105054680

版权

深度学习同时被 2 个专栏收录

52 篇文章

订阅专栏

计算机视觉

43 篇文章

订阅专栏

深度学习模型越来越强大的同时，也占用了更多的内存空间，但是许多GPU却并没有足够的VRAM来训练它们。

那么如果你准备进入深度学习，什么样的GPU才是最合适的呢？下面列出了一些适合进行深度学习模型训练的GPU，并将它们进行了横向比较，一起来看看吧！

太长不看版

截至2020年2月，以下GPU可以训练所有当今语言和图像模型：

RTX 8000：48GB VRAM，约5500美元
RTX 6000：24GB VRAM，约4000美元
Titan RTX：24GB VRAM，约2500美元

以下GPU可以训练大多数（但不是全部）模型：

RTX 2080 Ti：11GB VRAM，约1150美元
GTX 1080 Ti：11GB VRAM，返厂翻新机约800美元
RTX 2080：8GB VRAM，约720美元
RTX 2070：8GB VRAM，约500美元

以下GPU不适合用于训练现在模型：

RTX 2060：6GB VRAM，约359美元。

在这个GPU上进行训练需要相对较小的batch size，模型的分布近似会受到影响，从而模型精度可能会较低。图像模型内存不足之前的最大批处理大小：

*表示GPU没有足够的内存来运行模型。性能（以每秒处理的图像为单位）：

*表示GPU没有足够的内存来运行模型。语言模型内存不足之前的最大批处理大小：

*表示GPU没有足够的内存来运行模型。性能：

GPU没有足够的内存来运行模型。使用Quadro RTX 8000结果进行标准化后的表现图像模型

语言模型

结论:

语言模型比图像模型受益于更大的GPU内存。 注意右图的曲线比左图更陡。这表明语言模型受内存大小限制更大，而图像模型受计算力限制更大。
具有较大VRAM的GPU具有更好的性能，因为使用较大的批处理大小有助于使CUDA内核饱和。
具有更高VRAM的GPU可按比例实现更大的批处理大小。 只懂小学数学的人都知道这很合理：拥有24 GB VRAM的GPU可以比具有8 GB VRAM的GPU容纳3倍大的批次。
比起其他模型来说，长序列语言模型不成比例地占用大量的内存，因为注意力（attention）是序列长度的二次项。

GPU购买建议

RTX 2060（6 GB）：你想在业余时间探索深度学习。
RTX 2070或2080（8 GB）：你在认真研究深度学习，但GPU预算只有600-800美元。8 GB的VRAM适用于大多数模型。
RTX 2080 Ti（11 GB）：你在认真研究深度学习并且您的GPU预算约为1,200美元。RTX 2080 Ti比RTX 2080快大约40％。
Titan RTX和Quadro RTX 6000（24 GB）：你正在广泛使用现代模型，但却没有足够买下RTX 8000的预算。
Quadro RTX 8000（48 GB）：你要么是想投资未来，要么是在研究2020年最新最酷炫的模型。

附注图像模型：

语言模型：

来自Tim Dettmers的成本效益评测

https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/

卷积网络（CNN），递归网络（RNN）和transformer的归一化性能/成本数（越高越好）。RTX 2060的成本效率是Tesla V100的5倍以上。对于长度小于100的短序列，Word RNN表示biLSTM。使用PyTorch 1.0.1和CUDA 10进行基准测试。

从这些数据可以看出，RTX 2060比RTX 2070，RTX 2080或RTX 2080 Ti具有更高的成本效益。原因是使用Tensor Cores进行16位计算的能力比仅仅拥有更多Tensor Cores内核要有价值得多。

来自Tim Dettmers的建议：

总体最佳GPU：RTX 2070 GPU
避免使用：任何Tesla；任何Quadro；任何Founders Edition；Titan RTX，Titan V，Titan XP
高效但价格昂贵：RTX 2070
高效且廉价：RTX 2060，GTX 1060（6GB）
价格实惠：GTX 1060（6GB）
价格低廉：GTX 1050 Ti（4GB）。或者：CPU（原型设计）+ AWS / TPU（培训）；或Colab。
适合Kaggle比赛：RTX 2070
适合计算机视觉研究人员：GTX 2080 Ti，如果训练非常大的网络，建议使用RTX Titans

参考链接：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。