深度学习GPU算力平台推荐
你正在为深度学习项目寻找可靠且负担得起的GPU计算平台吗?
在本文中,我们将提供GPU强大平台的建议,可以帮助您最大限度地利用深度学习工作负载。无论你是数据科学家、研究人员还是学生,这些平台都能提供稳定高效的GPU计算能力来加速你的项目。从AutoDL的优质GPU租赁平台到NVIDIA的DGX系统试用活动,我们整理了一份资源清单,帮助您根据自己的需求做出最佳选择。请继续阅读,了解更多关于这些强大工具的信息,以及它们如何增强您的深度学习项目。
简介
AutoDL是一个深度学习GPU计算平台,为用户提供稳定可靠、价格公道的GPU算力,链接地址:
AutoDL AI算力云
其他GPU计算资源有:
- NVIDIA试用活动-体验用于 AI 和 HPC 的高速 GPU 服务器
- 并行超算云
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
- 添加链接描述
这里以AutoDL为准介绍GPU算力平台的使用,用户可以根据自己项目的需要进行GPU选型, 官网主页有显卡天梯榜。
为保证充分释放GPU的最大算力,需要对机器配置进行综合考量,官方文档如下:
添加链接描述
进入官方微信群可以相互交流技术,反馈问题,还有不定期福利:
AutoDL平台操作流程
- GPU选型:可根据官方网站提供的图形处理器天梯列表选择图形处理器,这里假设我需要进行半精度计算,根据天梯榜,选择NVIDIA RTX A5000作为计算卡。
- 点击算力市场->按量计费,通过切换可用区,发现内蒙A区有闲置的A5000计算卡,注意,一定要选右上角标有网盘支持的卡。
- 选择软件配置后即可使用,即可开始使用GPU,如果你有优惠券,记得勾选它,之后点击立即创建即可。充值500RMB会赠送优惠券,邀请新用户且新用户满足条件后也可以获得优惠券,还可以从官方微信群不定期获取优惠券。
- 进入实例界面后先关机,此时已经开始计费了,但考虑到我们进去后配置环境、更新Ubuntu系统等操作不需要GPU。我们这里先关机,之后以CPU模式使用实例,这些操作和阿里云的 PAI-DSW 是几乎一致的。
- 此时我们正在以CPU模式运行实例,点击JupyterLab按钮进入操作界面。
在AutoDL平台上挂载和使用阿里云盘
- 点击AutoPanel按钮进入实用程序页面,选择公网网盘选项卡。
- 设置独立访问密码,我这里选择阿里云盘,因为阿里云盘上传下载完全不限速,并且我现在已经有40TB空间了,终于暂时解决了我数据集存储的焦虑了,之后使用手机端阿里云盘APP扫码授权token就好。
注意:在使用网盘前,一定确保自己在AutoDL的容量是足够的,如果实例的磁盘容量不够,可以付费扩容数据盘。AtuoDL还提供快照保存等服务,只要你玩过阿里云ECS,那么这里的操作对你来讲会很简单。
PS-1:阿里云盘容量不够怎么办?
**解决方案1:**如果你是新用户,找一个达人的分享链接,转存达人的分享文件,你可以获得500GB。这里我已经准备好了,打开「阿里云盘」APP ,点击链接保存t016f49bb411fc14f89.jpg即可。
添加链接描述
**解决方案2:**找一个Lv3以上的阿里云盘达人,询问每月的200GB福利码。
**解决方案3:**做完福利社的卡片任务,做到每日签到。
**解决方案4:**多找几张手机卡注册小号,容量也不会很大,但会很麻烦,不方便管理。
**解决方案5:**充值SVIP,但阿里云盘现在只能充值8TB的会员,已经充值过20TB版本会员的老用户可以继续续费20TB版本。
PS-2:阿里云盘上传数据集,尤其是上万或几万的小文件总是丢文件怎么办?
阿里云盘正常上传文件时容易丢文件或上传失败,我甚至发工单问过这个问题,有以下4种失败可能,但问题并没有得到有效解决。
但后面我发现,使用备份空间的文件夹备份功能可以很好的解决这个问题,新建备份空间后云盘会自动同步本地文件。
上传完成后点击取消备份,弹窗提示:云端备份取消成功,云端文件仍为你保存。
在阿里云盘我的电脑文件夹中可以找到备份文件,此刻的备份文件将多出几个选项,选择移动就可以转移备份文件到其他位置了。
使用这种方法时,一次同步的文件上限是5000个,虽然变少了,但胜在稳定可靠,非常适合几KB的小文件。
PS-3:阿里云盘如何延期?
**解决方案1:**每日签到打卡,可以获得延期卡。
**解决方案2:**参加阿里云盘达人招募计划,参与享最高50TB容量、延期卡等福利。
**解决方案3:**完成福利社任务也有机会获得延期卡。
PS-4:除核心功能外,阿里云盘还提供了一些有用的额外功能
1:移动端搜索阿里云硬盘资源:手机APP端可以在全网搜索阿里云盘资源,更容易找到你需要的文件。
2:订阅:使用阿里云盘的订阅功能,可以关注喜欢的达人,并获得相关资源,比如“影视后期系统教学”,,以获得最新的软件资源和技巧。
3:目前已有针对阿里云盘的资源公众号和网站,下面给出两个资源站。
添加链接描述
添加链接描述
三、测试:使用阿里云ModelScope开放模型
1. 配置Anaconda3环境
# 实验出root文件夹是我所在的工作区
df -h
ls
cd ..
ls
cd root
ls
# 新建download文件夹并修改为最高权限
mkdir download
chmod -R 777 download/
# 下载并安装Python3.7版本的Anaconda3
cd download/
wget https://repo.anaconda.com/archive/Anaconda3-2021.11-Linux-x86_64.sh
bash ./Anaconda3-2021.11-Linux-x86_64.sh
Please, press ENTER to continue
>>>
Do you accept the license terms? [yes|no]
[no] >>> yes
[/root/anaconda3] >>>
PREFIX=/root/anaconda3
Unpacking payload ...
Do you wish the installer to initialize Anaconda3
by running conda init? [yes|no]
[no] >>> yes
# 重新加载Ubuntu的环境变量
root@autodl-container-1efe11963c-2e759383:~/download# source ~/.bashrc
# 查看版本等信息
(base) root@autodl-container-1efe11963c-2e759383:~/download# conda --version
(base) root@autodl-container-1efe11963c-2e759383:~/download# conda info --envs
(base) root@autodl-container-1efe11963c-2e759383:~/download# python -V
2. 配置ModelScope环境
# 新建虚拟环境
(base) root@autodl-container-1efe11963c-2e759383:~/download# conda create -n modelscope python=3.7
关机,切换为有卡模式运行,以便于查看CUDA等信息。
# 查看环境和显卡CUDA版本
(base) root@autodl-container-1efe11963c-2e759383:~/download# conda info --envs
(base) root@autodl-container-1efe11963c-2e759383:~/download# conda activate modelscope
(modelscope) root@autodl-container-1efe11963c-2e759383:~/download# nvidia-smi
# 配置modelscope虚拟环境
python -m pip install -U pip
# 安装pytorch
pip3 install torch torchvision torchaudio
# 安装tensorflow
wget https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-2.6.0-cp37-cp37m-manylinux2010_x86_64.whl
pip3 install tensorflow_gpu-2.6.0-cp37-cp37m-manylinux2010_x86_64.whl
# 安装modelscope的其他依赖包
wget https://files.pythonhosted.org/packages/47/bb/849011636c4da2e44f1253cd927cfb20ada4374d8b3a4e425416e84900cc/tqdm-4.64.1-py2.py3-none-any.whl
pip3 install tqdm-4.64.1-py2.py3-none-any.whl
pip3 install modelscope
pip3 install modelscope --upgrade
sudo apt-get update
sudo apt-get install libsndfile1
pip uninstall mmcv
pip install -U openmim
mim install mmcv-full
pip3 install "modelscope[audio,cv,nlp,multi-modal,science]" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
3. 使用ModelScope
新建一个jupyter文档,复制以下内容运行。
#BAStructBERT分词-中文-新闻领域-base
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
p = pipeline('word-segmentation', 'damo/nlp_structbert_word-segmentation_chinese-base')
p('阿里巴巴集团的使命是让天下没有难做的生意',)
{'output': ['阿里巴巴',
'集团',
'的',
'使命',
'是',
'让',
'天下',
'没有',
'难',
'做',
'的',
'生意']}
#RaNER命名实体识别-中文-电商领域-细粒度-base
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
p = pipeline('named-entity-recognition', 'damo/nlp_raner_named-entity-recognition_chinese-base-ecom-50cls')
p('eh 摇滚狗涂鸦拔印宽松牛仔裤 情侣款',)
{'output': [{'type': '品牌', 'start': 0, 'end': 2, 'span': 'eh'},
{'type': '品牌', 'start': 3, 'end': 6, 'span': '摇滚狗'},
{'type': '款式_其他', 'start': 6, 'end': 8, 'span': '涂鸦'},
{'type': '款式_其他', 'start': 8, 'end': 10, 'span': '拔印'},
{'type': '款式_其他', 'start': 10, 'end': 12, 'span': '宽松'},
{'type': '材质_面料', 'start': 12, 'end': 14, 'span': '牛仔'},
{'type': '产品_核心产品', 'start': 14, 'end': 15, 'span': '裤'},
{'type': '款式_其他', 'start': 16, 'end': 19, 'span': '情侣款'}]}
#StructBERT情感分类-中文-通用-base
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
p = pipeline('text-classification', 'damo/nlp_structbert_sentiment-classification_chinese-base')
p('这件衣服挺好看',)
{'scores': [0.8644708395004272, 0.13552914559841156], 'labels': ['正面', '负面']}
#卡证检测矫正模型介绍
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
p = pipeline('card-detection', 'damo/cv_resnet_carddetection_scrfd34gkps')
p('http://www.modelscope.cn/api/v1/models/damo/cv_resnet_carddetection_scrfd34gkps/repo?Revision=master\u0026FilePath=description/card_detection1.jpg',)
{'scores': [0.9295773506164551, 0.9260470271110535],
'boxes': [[446.90692138671875,
36.372108459472656,
907.0902099609375,
337.4408874511719],
[454.3436584472656,
336.0853576660156,
921.2640991210938,
641.7916259765625]],
'keypoints': [[457.3525390625,
339.02154541015625,
446.7286071777344,
52.900020599365234,
902.8233642578125,
35.05659103393555,
908.5930786132812,
325.62213134765625],
[465.28363037109375,
642.8425903320312,
454.39434814453125,
357.4068908691406,
902.5476684570312,
334.18072509765625,
922.1012573242188,
621.0780639648438]]}