【阿里云试用计划】免费试用GPU

最新推荐文章于 2025-04-28 13:50:53 发布

东荷新绿

最新推荐文章于 2025-04-28 13:50:53 发布

阅读量2.2k

点赞数 3

分类专栏：资源推荐文章标签：阿里云云计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44853527/article/details/131870310

版权

资源推荐专栏收录该内容

2 篇文章

订阅专栏

写在前面：本博客仅作记录学习之用，部分图片来自网络，如需引用请注明出处，同时如有侵犯您的权益，请联系删除！

文章目录

前言
试用步骤
问题
- No CUDA GPUs are available
- 无故被killed
致谢

前言

算力在深度学习中扮演着非常重要的角色，深度学习模型通常包含大量的参数和复杂的计算图，需要对大规模数据进行训练和推断。随着数据集越来越大，各种深度学习任务如图像、扩散模型、多模态、大模型等对算力的要求也稳步较高、为提高模型性能网络参数也逐步提升，以至于想要体验都不方便，更别提需要训练网络的学生。因此白嫖算力成为一种无奈之举，下面提供一种途径：阿里云试用计划。希望对小伙伴们有帮助。

试用步骤

阿里云深度学习服务器和常见AutoDL、mistGPU略有不同，想要快速上手参考下列步骤。

网址：阿里云免费试用，注意这是针对新用户的活动，截止时间8.31。因此需要注册一个账号。
界面如下：
在这里插入图片描述

点击机器学习平台，进入下图

在这里插入图片描述

点击交互式建模，最好看下试用教程。教程是stable-diffusion，因此体验文字（英文）生成图像跟着教程即可。立即试用，进入下图

在这里插入图片描述

跟着试用教程，创建实例。这里是我以前创建的实例。创建实例，进入下图
配置实例。名称啥的随意，注意选择GPU、镜像（体验教程记得选择stable-diffusion的镜像）。创建实例，进入下图

在这里插入图片描述

确认配置和金额后创建，如需要安全组、交换机等可自行创建。确认无误后创建
再次进入交互式建模，可以看到就创建好实例了，后面就是环境和数据上传了。
选择实例进入，可以具体的配置信息。

在这里插入图片描述

开机进入实例，主要是jupyter、webIDE、终端。教程stable-diffusion主要在jupyter中，创建配置环境并实现生成图像。如果需要配置自己的环境，进入终端，使用pip配置即可。

在这里插入图片描述

数据，默认挂载需要oss或者ssd，如果数据集很大的话还是建议去挂载。数据不大直接上传打包上传即可，避免其他一些操作。调试修改使用webIED，这个使用ssh和比较麻烦，不方便和pycharm配合使用。
在解压出来，使用以下命令
unzip yourdata.zip -d unzip_path
最后运行，芜湖起飞。

问题

No CUDA GPUs are available

详细的报错内容：出现在 .to(device)

torch._C._cuda_init() No CUDA GPUs are available

但是torch显示cuda可用，如下

torch.cuda.is_available()  # true
torch.cuda.device_count()  # 1

解决办法：
在脚本中添加：

os.environ['CUDA_VISIBLE_DEVICES'] = '0'

无故被killed

报错截图如下：
在这里插入图片描述
原因：占用的显存太大，系统为保持稳定，kill进程。
解决办法：调小参数，如batch-size等，占用显存略小于16G即可。

致谢

欲尽善本文，因所视短浅，怎奈所书皆是瞽言蒭议。行文至此，诚向予助与余者致以谢意。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

东荷新绿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。