跑项目怎样选择GPU，不同GPU特点总结

最新推荐文章于 2024-11-12 16:02:01 发布

三木108

最新推荐文章于 2024-11-12 16:02:01 发布

阅读量2k

点赞数

文章标签：青少年编程机器学习

本文链接：https://blog.csdn.net/m0_73939236/article/details/132042884

版权

GPU非常重要，尽管GPU并不直接参与深度学习模型计算，但GPU需要提供大于模型训练吞吐的数据处理能力。

下面是一些GPU型号的简介：

Tesla P40，显存24GB，单精（FP32）11.76T，半精（FP16）11.76T，它是比较老的Pascal架构GPU，对于cuda11.x之前且对大显存有需求的算法是非常不错的选择
TITAN Xp，显存12GB，单精（FP32）12.15T，半精(FP16)12.15T，它是比较老的Pascal架构GPU，用作入门比较合适。
1080Ti，显存11GB，单精11.34T，半精11.34T，它和TITANXp是同时代的卡，同样适合入门，但是11GB的显存偶尔会比较尴尬。
2080Ti，显存11GB，单精13.45，半精53.8，它是图灵架构GPU，性能还不错，老一代型号中比较适合做混合精度计算的GPU，性价比高。
V100，显存16/32GB，单精15.7T，半精125T，它是老一代专业计算卡皇，半精性能高适合做混合精度计算
3060,显存12GB，单精12.74T，半精约24T，如果1080Ti的显存正好尴尬，3060是不错的选择，适合新手，需要使用cuda11.x
A4000显存16GB，单精19.17T，半精约76T，显存和算力都比较均衡，适合进阶过程使用，需要使用cuda11.x
3080Ti，显存13GB，单精34.10T，半精约70T，性能钢炮，如果对显存要求不高则非常适合的选择，需要使用cuda11.x
A5000，显存24GB，单精27.77T，半精约117T，性能钢炮，如果觉得3080Ti的显存不够用A5000是合适的选择，并且半精算力高适合混合精度，需要使用cuda11.x
3090，显存24GB，单精35.58T，半精度约71T，可以先做3080Ti的扩显存版，性能和显存大小都非常够用，使用性非常强性价比首选，需要使用cuda11.x
A40，显存48GB，单精37.42T，半精149.7T，可以看做是3090的扩显存版，算力和3090基本持平，因此根据显存大小进行选择，需要使用cuda11.x
A100SXM4，显存40/80GB，单精19.5T，半精312T，新一代人专业计算卡皇，除了贵没缺点，显存大，非常适合做半精计算，因为有NVLinK加持，多卡并行加入比非常高，需要使用cuda11.x