深度学习训练吃显卡_深度学习小钢炮攒机心得：规避一些你看不到的坑

最新推荐文章于 2023-02-26 20:40:34 发布

weixin_39924584

最新推荐文章于 2023-02-26 20:40:34 发布

阅读量1.2k

点赞数 1

文章标签：深度学习训练吃显卡

本文链接：https://blog.csdn.net/weixin_39924584/article/details/111493552

版权

———————————————————

已经2017年了，从90年代初的品牌机流行，90年代末的组装机流行，2000-2010桌面级逐渐被移动PC/Mac取代，一直到现在移动终端大行其道，攒机似乎已经走过一个完整的生命周期。而因为2008年老黄开始攒GPGPU的大招，一直到2014年开始深度学习的逐渐兴起，台式家用机开始扮演起另外的角色：家用作坊小钢炮。

一直在掉坑的我在此拿出一些心得，与大家分享。

———————————————————-

1 显卡篇

首先要说明一点，在家搞深度学习不是在云端部署用于深度学习的卡那样，所以NVidia的Tesla系列主打单精度的计算显卡、Quadro系列双精度计算卡固然好，但是性价比实际不堪一击，具体可以参考：

深度学习是一种概率推断工具，常见于人工智能应用(图像视频识别、语音识别、文本处理、自动对话等)，这跟发射火箭需要高精度计算以及纠错(ECC)不一样，一个深度神经网络对单个参数精度的依赖其实很低，不需要双精度计算能力，因此能看到Tesla系列的显卡和此处的10x0系列游戏卡一样，都是设计成为极高的单精度计算能力和极低的双精度计算能力的。所以在生产设计之初这些卡就注定是为了深度学习而生的。

实际上，如果你主要跑的是LSTM这种结构的应用(比如文本、语音、OCR)，参数比较少的时候，1060的6GB显存已经足够，当然它的算力有些乏善可陈了(3.8T/睿频4.4T)。如果你只跑CV的训练，如大规模残差网络(在公司一个152层的ResNet，数据并行，直接每张卡吃了7G显存，可以8卡并行获得一个可观的加速比)，如果你的公司不提供算力，你也不喜欢直接在云平台上花钱训练的化，那么可能一个大显存的Titan X Pascal (12GB)更适合你。1070和1080就比较中庸，这个根据个人的兴趣和钱包综合选择即可。

有人想要问了，我有钱，还是想买个人用的M系列(M40，M60)、P系列(P100)等显卡，而且想多卡并行，该怎么办？这个已经脱离个人家用作坊的定义了，价格从几十万到一百万不等，建议还是直接找NVidia原厂、华硕等能提供质保的大厂提供销售服务。

还有人问，我很有钱，还是想买双卡GPU做训练，这个问题已经牵涉到主板的选择，我们放到后面再讨论，但可以先说结论：强行上双卡，会极大的拉低整机性价比，而且最终训练效果的提升未必如你想象的那

最低0.47元/天解锁文章

weixin_39924584

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习训练吃显卡_深度学习小钢炮攒机心得：规避一些你看不到的坑

———————————————————已经2017年了，从90年代初的品牌机流行，90年代末的组装机流行，2000-2010桌面级逐渐被移动PC/Mac取代，一直到现在移动终端大行其道，攒机似乎已经走过一个完整的生命周期。而因为2008年老黄开始攒GPGPU的大招，一直到2014年开始深度学习的逐渐兴起，台式家用机开始扮演起另外的角色：家用作坊小钢炮。一直在掉坑的我在此拿出一些心得，与大家分享。—...
复制链接

扫一扫