slurm 节点
查看总的slurm信息需要在manager节点登录:
比方说
ssh root@manager
su admin
一般会有三层节点:
第一层是登陆节点,你一登陆,就回到这个节点,显示root@login0$
第二层是管理节点,在这个节点可以操作、查看硬件资源,显示root@manager$
第三层是计算节点,你也可以进去看看。
以上的节点名都是举例,真正的命名看你
节点之间的切换需要用root帐户
在管理节点,需要登录管理账户。
节点命令
查看提交的作业:
squeue
取消作业102
scancel 102
查看节点cpu核,使用信息
sinfo --format="%12P %.10n %.5T %.14C"
matlab 与 slurm
如果用并行,需要在matlab中,声明并行池
clust = parcluster('SlurmProfile2');
clust.SubmitArguments = '-n 10 -N 1';
pool = parpool(clust,10)
delete pool
如果运行matlab的.m文件,那么可以
matlab -nodesktop -nosplash -r matlabfile
当然也可以先matlab进去,再执行。
还有在后台提交任务的,请自行搜索。
不过本次实验并没有跨节点,基本都是在计算节点直接提交任务。如果在管理节点提交任务,则不能操控并行池。同时容易被killed。
在计算节点,能够开启普通的并行池,同时不会被killed。但是不能利用跨节点资源。比如内存,内核。