processing游戏代码_深度学习GPU实战评测:矿卡 vs 游戏卡 vs 专业卡

b63744477570377c4b437771d41ecbe7.png

相信不少混迹 Kaggle、天池 的同学都有算力不足的困扰,如果你还在靠薅资本主义羊毛(指 colab,kaggle kernel)勉强度日,这篇文章应该会对你有所帮助(末尾有福利)。

自己搭建一个适合打竞赛的深度学习主机到底要花多少钱?如果在某宝直接搜索「深度学习」后一定会劝退不少有这种想法的同学。

4e96d27366f73eea90aca3128c280a5e.png

其实,如果使用二手硬件配置 + 矿卡,一台可用来打竞赛的主机可能只需要 3000 不到就够了。


试验

下面是各个显卡的实战评测,实战项目选用 Kaggle TGS ,参赛选手依次为:

  • 矿卡科代表 P106-100
  • 游戏卡科代表 RTX 1080 ti
  • 特斯拉科代表 P80(Colab)
  • 没有卡科代表 CPU: Intel(R) Core(TM) i3-9100F CPU @ 3.60GHz

注意,这不是严格的基准测试,只是用我之前做过的一个比赛来看看就实际问题各个 GPU 的表现如何,代码都是同一套,但其他硬件配置会稍有不同。

测试都使用了同一套代码,核心逻辑为使用 Unet + ResNet34,对 TGS 官方数据集 的训练集训练一轮后停止,为尽可能测试到 GPU 速度,忽略掉了模型的存储、图片增强等逻辑。

4 个试验的笔记本都已公开分享,可以在笔记本中找到更详细的结论、机器配置以及整个训练代码,下面是各个训练的结果:

CPU ONLY:

77fe3305a612c55578ca5ffbcf970656.png
CPU 训练截图

总共用时:301s 平均每秒迭代:1.21次

公开笔记本地址:https://featurize.cn/notebooks/61fa4116

专业卡 K80(Colab)

135b7beea1b18aaf32427422c4b1c5a0.png
K80 训练截图

总共用时:108s 平均每秒迭代:2.3次

公开笔记本地址:https://colab.research.google.com/drive/18XsWJUrBOeKQ3Kl8EffmEhzpIByPtxc2?usp=sharing

游戏卡 RTX 1080 ti

fe3aee0ad296d4f042c475961d20af5a.png
1080ti 训练截图

总共用时:21s 平均每秒迭代:12次

公开笔记本地址:https://featurize.cn/notebooks/d0e14ae3

矿卡 P106-100

37321f40238e90bce8ae516d2a93c0fd.png
P106-100 训练截图

总共用时:48s 平均每秒迭代:5.2次

公开笔记本地址:https://featurize.cn/notebooks/61fa4116


结论

每秒可执行的 iterations 对比:

0b9ce315bb759b1a238ec04b990f1457.png

获胜者当然是用 jio 都能想到的 1080ti,不过 K80 比某宝500块一张的矿卡慢一倍这是我没想到的。当然这里有很多其他影响因素,Google Colab 的 CPU 只有两核,但代码里都使用了 4 个进程的数据加载器,并且 1080 ti 以及 P106 都是运行在独立的物理机上的。

下面是 P 106 跟其他 GPU 的参数对比,

参考:

https://en.wikipedia.org/wiki/Nvidia_Tesla

https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units

https://www.techpowerup.com/gpu-specs/p106-100.c2980

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值