在集群上分配/释放资源

本文介绍了IT集群中的登录和计算节点操作,包括使用`squeue`查看资源分配,`salloc`申请CPU和GPU资源,通过SSH进行节点切换,以及如何使用`scancel`取消作业和通过`nvidia-smi`查看GPU状态。
摘要由CSDN通过智能技术生成

集群主要分为登录节点和计算节点,需要先开辟空间进入计算节点才能进行一些耗费资源的行为。
最常用的命令:
查看资源分配

squeue

cpu获取资源

salloc

GPU获取资源,其中的n为需要的GPU数量

salloc --gres=gpu:tesla:n

ssh登录节点,其中的n为获得的序号

ssh cpun/gpun

取消作业

scancel 作业编号(比如1234,并不是GPUn或CPUn)

ssh进入计算节点后,可以通过下面的命令查看获得的GPU型号内存空间:

nvidia-smi
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值