相信和我一样,有很多刚入门学习ML、DL的亲们都会遇到一个问题,那就是没有足够的算力去跑自己的网络。而自己去买一块显卡可能又成本太高。在我研究了数天,尝试了各种云资源之后,现在终于总结出低成本高效的云服务了。
本来想在这篇文章的标题加上“新手”两字的,但是实际上即使是高手也同样可以很好的使用到这些资源。
这次我介绍和对比的资源主要来自于以下几个平台
-
微软Azure云
-
谷歌GCP
-
淘宝GPU机器
-
美团云
(想看结论的亲们可以直接拉到最下面)
微软Azure云
Azure在国内并不是特别出名,而且国内的Azure也很坑(Azure分中国版和国际版),我们此次说的是国际版的Azure。
在国际版的Azure中,可以申请试用,这需要你有一张Visa或者MasterCard的信用卡。申请试用后可以在一个月内使用200美刀的额度,而且一个月后还可以继续使用Azure的免费服务。
立即创建 Azure 免费帐户 | Microsoft Azure
在这时,我们会发现,虽然有额度,但是有的区域的虚拟机是无法创建的,而可以创建的VM中好像没有GPU的机器。实际上是有的,只是藏得比较深。不过Azure的配额是可以通过反馈提交申请的,似乎也没有什么额外要求。下图是申请在东南亚区使用NV系列虚拟机成功后的邮件。
显卡型号 单精度浮点 价格 位置
P100 | 10.6T | 1848 | 美国中南部
M60 | 9.7T | 894 | 美国东部2
K80 | 8.74T | 736 | 美国东部2
如果使用额度的话,看这样子是不是还可以,能跑几天?但是有个关键点,以上的单精度浮点运算能力并不是这个机器真实的运算能力。微软卖的是显卡核芯,双芯卡会被拆成两台机器来卖。比如如果选择的是K80的机器,实际单精度浮点性能只有4.111T。
选择Azure时,配置上也有坑。如果选择的是普通的Windows或Linux系统,上面是不会预置任何东西的。Python、CUDA、CuDNN、甚至显卡驱动都要你自己装。但是在可选系统里其实是有已经配置好的系统可选的。打个比方,我可以在“新建”→“搜索”里搜索“tensorflow”。