作为深度学习入门选手来说,主要白嫖过两种gpu服务器:colab和阿里云的DSW,先说说这两款的特点
colab
优点:
- 网上教程很多,对于刚入门而自己电脑显卡又不行的新手很友好,基本环境配好的,需要什么库临时pip就好
- 使用方法简单,与Google drive结合起来读取文件方便;
- 有的代码能直接跳转到colab跑demo;
缺点:
- 需要魔法上网,会出现网络不稳定的情况
- 免费12h的限制(一个月前训练超过12h就不让我用了,看网上说过一段时间会恢复使用,但一直没给我恢复使用,所以转战白嫖阿里云)
- 下次重启机器时,之前自己配的环境会清空,只保留官方的环境
- Google drive没开会员的话,存储容量只有15GB,如果数据集太大,要考虑扩容
总之,colab适合新手短期使用,测试小demo,长期使用的话,还是考虑其他gpu服务器。
阿里云的DSW
这个服务器的发现是因为我训练时间超过12h,colab暂时不让我用显卡了,秉持着能省就省的原则,经过搜索后发现能白嫖5000算力的阿里云GPU服务器,折合下来能用几百个小时,真香~
优点:
- 使用时长根据你选的显卡配置而定,用5000算力/所选显卡每小时消耗的算力,博主当时只有V100可选,折算下来大概300多小时,对个人来说暂时够了。
- 配置好的环境,关机重启后依然存在,看提示是15天不启动会自动释放,没验证过,没这么久不启动。
- 差不多就相当于正常电脑使用,存储容量够用,博主上传了1GB+3GB+7GB数据集也稳妥,不需要单独扩充存储。
缺点:
- 需要自己动手简单配置一下
- 开机启动缓慢
- 上传数据集缓慢,上传那个3GB的数据集传了6个小时左右,不太明白为什么上传那么久,我自己的网也有一部分原因
- 最大的bug!!!在上传数据集时,是没使用显卡的,后台有闲置关机策略,有次上传数据集到4小时左右,自动关机了!!!天塌了,又得重新上传,暴风螺旋哭泣
具体如何白嫖参考:阿里云机器学习Pai-DSW服务器部署教程
后续再出一个我自己的配置教程和使用方法,that’s all。