深度学习硬件配置-CSDN博客

本文链接：https://blog.csdn.net/ynca67269/article/details/127244912

深度学习对硬件的要求

之前热衷于学习理论知识，目前想跑代码了发现不知道从何下手，自己电脑上搭建的平台基本就是个摆设，因为跑不起来呀。今天我们就来看看想做深度学习应该怎么下手。

首先了解下基础知识：1、深度学习用cpu训练和用gpu训练的区别（1）CPU主要用于串行运算；而GPU则是大规模并行运算。由于深度学习中样本量巨大，参数量也很大，所以GPU的作用就是加速网络运算。

（2）CPU算神经网络也是可以的，算出来的神经网络放到实际应用中效果也很好，只不过速度会很慢罢了。而目前GPU运算主要集中在矩阵乘法和卷积上，其他的逻辑运算速度并没有CPU快。

目前来讲有三种训练模型的方式：1. 自己配置一个“本地服务器”，俗称高配的电脑。这个选择一般是台式机，因为笔记本的“高配”实在是太昂贵了，同一个价格可以买到比笔记本好很多的配置。

如果是长期使用，需要长期从事深度学习领域的研究，这个选择还是比较好的，比较自由。① 预算一万以内的机器学习台式机/主机配置：② 从李飞飞的课程里，可以看到她的电脑配置，这个配置是机器学习的基本设置。

内存：4X8G 显示卡：两个NV GTX 1070硬盘： HDD一个， SSD两个③ 配置主机需要了解的参数（在上一篇博客中已经详细介绍了各个参数的含义）：GPU：一个好的GPU可以将你的训练时间从几周缩减成几天，所以选GPU一定要非常慎重。

可以参看GPU天梯榜，都是一些比较新的型号具有很强的性能。在英伟达产品系列中，有消费领域的GeForce系列，有专业绘图领域的Quadro系列，有高性能计算领域的Tesla系列，如何选择？

有论文研究，太高的精度对于深度学习的错误率是没有提升的，而且大部分的环境框架都只支持单精度，所以双精度浮点计算是不必要，Tesla系列都去掉了。

从显卡效能的指标看，CUDA核心数要多，GPU频率要快，显存要大，带宽要高。这样，最新Titan X算是价格便宜量又足的选择。CPU：总的来说，你需要选择一个好的GPU，一个较好的CPU。

作为一个高速的串行处理器，常用来作为“控制器”使用，用来发送和接收指令，解析指令等。

由于GPU内部结构的限制，使得它比较适合进行高速的并行运算，而并不适合进行快速的指令控制，而且许多的数据需要在GPU和CPU之间进行存取，这就需要用到CPU，因为这是它的强项。

内存条：主要进行CPU和外设之间的数据交换，它的存取速度要比硬盘快好几倍，但是价格比较昂贵，通常会和容量成正比。

内存大小最起码最起码最起码要大于你所选择的GPU的内存的大小（最好达到显存的二倍，当然有钱的话越大越好）。在深度学习中，会涉及到大量的数据交换操作（例如按batch读取数据）。

当然你也可以选择将数据存储在硬盘上，每次读取很小的batch块，这样你的训练周期就会非常长。

常用的方案是“选择一个较大的内存，每次从硬盘中读取几个batch的数据存放在内存中，然后进行数据处理”，这样可以保证数据不间断的传输，从而高效的完成数据处理的任务。

电源问题：一个显卡的功率接近300W，四显卡建议电源在1500W以上，为了以后扩展，可选择更大的电源。固态硬盘：作为一个“本地存储器”，主要用于存储各种数据。由于其速度较慢，价格自然也比较便宜。

建议你选择一个较大容量的硬盘，通常会选择1T/2T。一个好的方法是：“你可以利用上一些旧的硬盘，因为硬盘的扩展十分简单，这样可以节省一部分资金。”

谷歌人工智能写作项目：神经网络伪原创

求推荐适合深度学习的服务器

深度学习起源于神经网络，但现在已超越了这个框架好文案。

至今已有数种深度学习框架，如深度神经网络、卷积神经网络和深度置信网络和递归神经网络等，已被应用计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

深度学习的动机在于建立可以模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像、文本和声音等。

深度学习通过学习一种深层非线性网络结构，只需简单的网络结构即可实现复杂函数的逼近，并展现了强大的从大量无标注样本集中学习数据集本质特征的能力。

深度学习能够获得可更好地表示数据的特征，同时由于模型的层次深（通常有5层、6层，甚至10多层的隐层节点，百度“深”的好处是可以控制隐层节点的数目为输入节点数目的多项式倍而非多达指数倍）、表达能力强，因此有能力表示大规模数据。

蓝海大脑作为深度学习服务器的专业厂商，建议您选择深度学习服务器时需要注意以下几点：1.深度学习需要大量的并行计算资源，而且动辄计算几天甚至数周，而英伟达NVIDIA、英特尔Intel、AMD 显卡（GPU)恰好适合这种工作，提供几十上百倍的加速，性能强劲的GPU能在几个小时内完成原本CPU需要数月完成的任务，所以目前深度学习乃至于机器学习领域已经全面转向GPU架构，使用GPU完成训练任务。

2.如今即使使用GPU的深度学习服务器也要持续数天乃至数月（取决于数据规模和深度学习网络模型），需要使用单独的设备保障,保证训练任务能够7x24小时长期稳定运行。

3.独立的深度学习工作站（服务器）可以方便实现实验室计算资源共享，多用户可以在个人电脑编写程序，远程访问到深度学习服务器上排队使用计算资源，减少购买设备的开支并且避免了在本地计算机配置复杂的软件环境。

蓝海大脑通过多年的努力，攻克了各项性能指标、外观结构设计和产业化生产等关键技术问题，成功研制出蓝海大脑深度学习水冷工作站 HD210 系列。

该产品图形处理速度快，支持 GPU 卡热插拔，具有高性价比，低噪音等特点，外形美观，满足了人工智能企业对图形、视频等信息的强大计算处理技术的需求。更好地为深度学习训练服务。

型号蓝海大脑深度学习服务器英特尔处理器 Intel Xeon Gold 6240R 24C/48T,2.4GHz,35.75MB,DDR4 2933,Turbo,HT,165W.1TB Intel Xeon Gold 6258R 28C/56T,2.7GHz,38.55MB,DDR4 2933,Turbo,HT,205W.1TB Intel Xeon W-3265 24C/48T 2.7GHz 33MB 205W DDR4 2933 1TB Intel Xeon Platinum 8280 28C/56T 2.7GHz 38.5MB,DDR4 2933,Turbo,HT 205W 1TB Intel Xeon Platinum 9242 48C/96T 3.8GHz 71.5MB L2,DDR4 3200,HT 350W 1TB Intel Xeon Platinum 9282 56C/112T 3.8GHz 71.5MB L2,DDR4 3200,HT 400W 1TBAMD处理器 AMD锐龙Threadripper Pro 3945WX 4.0GHz/12核/64M/3200/280W AMD锐龙Threadripper Pro 3955WX 3.9GHz/16核/64M/3200/280W AMD锐龙Threadripper Pro 3975WX 3.5GHz/32核/128M/3200/280W AMD锐龙Threadripper Pro 3995WX 2.7GHz/64核/256M/3200/280W AMD锐龙Threadripper Pro 5945WX 4.1G 12核/64M/3200/280W AMD锐龙Threadripper Pro 5955WX 4.0G 16核/64M/3200/280W AMD锐龙Threadripper Pro 5965WX 3.8G 24核/128M/3200/280W AMD锐龙Threadripper Pro 5975WX 3.6G 32核/128M/3200/280W AMD锐龙Threadripper Pro 5995WX 2.7G 64核/256M/3200/280W显卡 NVIDIA A100×4, NVIDIA GV100×4 NVIDIA RTX 3090×4, NVIDIA RTX 3090TI×4, NVIDIA RTX 8000×4, NVIDIA RTX A6000×4, NVIDIA Quadro P2000×4,NVIDIA Quadro P2200×4硬盘 NVMe.2 SSD: 512GB，1TB； M.2 PCIe - Solid State Drive (SSD), SATA SSD: 1024TB, 2048TB, 5120TB SAS:10000rpm&15000rpm,600GB,1.2TGB,1.8TB HDD : 1TB，2TB,4TB,6TB,10TB 外形规格立式机箱 210尺寸mm（高*深*宽) : 726 x 616 x 266 210A尺寸mm（高*深*宽) : 666 x 626 x 290 210B尺寸mm（高*深*宽) : 697 x 692 x 306 声卡：7.1通道田声卡机柜安装 : 前置机柜面板或倒轨（可选）电源功率 : 1300W×2; 2000W×1软件环境可预装 CUDA、Driver、Cudnn、NCCL、TensorRT、Python、Opencv 等底层加速库、选装 Tensorflow、Caffe、Pytorch、MXnet 等深度学习框架。

前置接口 USB3.2 GEN2 Type-C×4 指承灯电和硬盘LED 灵动扩展区 : 29合1读卡器，eSATA，1394，PCIe接口（可选）读卡器 : 9合1SD读卡器（可选）模拟音频 : 立体声、麦克风后置接口 PS2接口 : 可选串行接口 : 可选 USB3.2 GEN2 Type-C×2 网络接口 : 双万兆 (RJ45) IEEE 1394 : 扩展卡口模拟音频 : 集成声卡 3口连接线专用屏蔽电缆（信号电缆和电源电缆）资料袋使用手册、光盘1张、机械键盘、鼠标、装箱单、产品合格证等。

mac跑深度学习会炸吗

为什么说深度学习需要GPU呢？

研究深度学习和神经网络大多都离不开GPU，在GPU的加持下，我们可以更快的获得模型训练的结果。

深度学习和神经网络的每个计算任务都是独立于其他计算的，任何计算都不依赖于任何其他计算的结果，可以采用高度并行的的方式进行计算。

而GPU相比于CPU拥有更多独立的大吞吐计算通道，较少的控制单元使其不会受到计算以外的更多任务的干扰，所以深度学习和神经网络模型在GPU的加持下会高效地完成计算任务。

我们公司的GPU用的就是思腾合力家的，思腾合力深思系列产品就很适用于人工智能和深度学习训练等多领域GPU服务器，产品还挺好用。

学习神经网络和深度学习需要什么硬件

深度学习用cpu训练和用gpu训练有什么区别

1、深度学习用cpu训练和用gpu训练的区别（1）CPU主要用于串行运算；而GPU则是大规模并行运算。由于深度学习中样本量巨大，参数量也很大，所以GPU的作用就是加速网络运算。

2、深度学习深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习是机器学习中一种基于对数据进行表征学习的方法。

观测值（例如一幅图像）可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。

使用神经网络训练，一个最大的问题就是训练速度的问题，特别是对于深度学习而言，过多的参数会消耗很多的时间，在神经网络训练过程中，运算最多的是关于矩阵的运算，这个时候就正好用到了GPU，GPU本来是用来处理图形的，但是因为其处理矩阵计算的高效性就运用到了深度学习之中。

什么是深度学习？深度学习能用来做什么？

深度学习是基于机器学习延伸出来的一个新的领域，由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展，并伴随大数据和计算能力的提高而产生的一系列新的算法。

在深度学习中，计算机模型学习直接从图像、文本或声音中执行分类任务。深度学习模式可以达到新的精确度，有时甚至超过人类的表现。

大多数深度学习方法使用神经网络的架构，这也是深度学习模型通常被称为深度神经网络的原因。

深度学习学什么？

深度学习主要学的有：神经网络、BP反向传播算法、TensorFlow深度学习工具等。

深度学习英文全称为：deep learning，是机器学习的分支，主要是把人工神经网络当作构架，进而对数据进行表征学习的算法。

至今已有数种深度学习框架，如深度神经网络、卷积神经网络和深度置信网络和递归神经网络已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

另外，“深度学习”已成为类似术语，或者说是神经网络的品牌重塑。通过多层处理，逐渐将初始的“低层”特征表示转化为“高层”特征表示后，用“简单模型”即可完成复杂的分类等学习任务。

由此可将深度学习理解为进行“特征学习”或“表示学习”。以往在机器学习用于现实任务时，描述样本的特征通常需由人类专家来设计，这成为“特征工程”（feature engineering）。

众所周知，特征的好坏对泛化性能有至关重要的影响，人类专家设计出好特征也并非易事；特征学习（表征学习）则通过机器学习技术自身来产生好特征，这使机器学习向“全自动数据分析”又前进了一步。

而深度学习的主要应用场景为：语音识别微软研究人员通过与hinton合作，首先将RBM和DBN引入到语音识别声学模型训练中，并且在大词汇量语音识别系统中获得巨大成功，使得语音识别的错误率相对减低30%。

但是，DNN还没有有效的并行快速算法，很多研究机构都是在利用大规模数据语料通过GPU平台提高DNN声学模型的训练效率。

在国际上，IBM、google等公司都快速进行了DNN语音识别的研究，并且速度飞快。国内方面，阿里巴巴，科大讯飞、百度、中科院自动化所等公司或研究单位，也在进行深度学习在语音识别上的研究。

自然语言处理等其他领域很多机构在开展研究，2013年Tomas Mikolov,Kai Chen,Greg Corrado,Jeffrey Dean发表论文Efficient Estimation of Word Representations in Vector Space建立word2vector模型，与传统的词袋模型（bag of words）相比，word2vector能够更好地表达语法信息。

深度学习在自然语言处理等领域主要应用于机器翻译以及语义挖掘等方面。

什么是深度学习？如何保持深度学习？

现在的科技发展速度非常快，对于智能设备将是一个发展方向，而其实我们以为的智能设备并不具备我们这样的学习能力，他们是通过无数图片，视频去发现其中的学习秘密，然后慢慢发展成为智能化的，其中大家最熟知的就是深度学习这个词了，但是很多人不知道什么是深度学习？

如何保持深度学习？其实简单来说就是电脑芯片的深度挖掘，可以让芯片处于长时间的工作达到保持深度学习。

首先深度学习这个词并不是用于我们人类上的，如果让人类深度学习估计会崩溃，这是非常巨大的工程，我们现在把机械的芯片当做一个有生命体的存在，但是他们的灵智非常差，他们想要学习达到高水平，就必须每时每刻保持着工作去发现，而这时候就需要从外界给他们无数的例子，他们才能够掌握其中的秘密，这就是现在的人工智能识别图片的功能来源。

他们一天看无数个图片，才能够具有识别的功能，而这其实就非常像挖矿，需要芯片不断长时间去工作，一直挖掘着一大坐山一样的存在，我们人类可以休息，但是他们不行，他们是机械，想要很快地进展就必须每时每刻地学习，这就是所谓的深度学习了。

这里其实我们就可以看做平时挖矿人员，用显卡去挖矿，不是一张显卡就能搞定的，需要弄很多显卡成一个工作室，来同时不间断挖矿，但是这也是非常消耗芯片寿命的，这样的显卡一般寿命都无法保证，说个题外话，也不建议懂电脑的人去买矿卡，虽然便宜但是没有任何保证，说不定哪天打游戏就突然挂了，这是没有任何维修的，不要贪图这种小便宜。