服务器nohup使用

第二章 服务器

一、任务提交的两种方法

1.qsub

不能实时监控,只能等运行结束了看最终结果,当然或者是error中断了。所以自从知道了nohup几乎不再用qsub了,当然可能有优点,但是我暂且还没有发现(仅和nohup相比)
使用qsub需要写个bash脚本

例1

# gpu_resnet.sh
source activate
conda deactivate

cd /share2/pub/yangjy/yangjy/image/ResNet/
/share2/pub/yangjy/yangjy/conda3/bin/python /share2/pub/yangjy/yangjy/image/ResNet/code/train.py

如果需要将任务提交到gpu02节点,申请的cpu数为5,内存为30GB

qsub gpu_resnet.sh -q gpu02 -l ncpus=5 -l mem=30gb

例2

# cpu_resnet.sh
#!/bin/sh
#PBS -N resnet_cpu
#PBS -l nodes=fat03
#PBS -q fat
#PBS -l walltime=1000:00:00
#PBS -j oe

source activate
conda deactivate

cd /share2/pub/yangjy/yangjy/image/ResNet/
/share2/pub/yangjy/yangjy/conda3/bin/python /share2/pub/yangjy/yangjy/image/ResNet/code/train.py

将任务提交到fat队列(-q fat)的fat03节点(-l nodes=fat03),没有指定cpu个数和内存使用量,自动分配内存,默认cpu使用1个

  • 提交 qsub 脚本名 *
    注: *表示其他参数,可加可不加,如果在脚本中没有写明了在哪一个队列和哪一个节点或者更多信息,可以在提交任务的时候显式写出,如例1。如果在脚本中注明了,则可以直接提交
qsub gpu_resnet.sh -q gpu02 -l ncpus=5 -l mem=30gb
# 或
qsub cpu_resnet.sh
  • 查看运行情况
qstat
  • 中断任务 qdel taskid
qdel 756793

qsub 最终回生成一个.e文件是error的文本,还有一个.o文件是日志文本

2.nohup

提交后可以在后台查看运行的状况(实时监控)nohup 操作 文件名 &>log文件名&

  • 提交
nohup python train_v2.py &> ./swin.out&

在这里插入图片描述

  • 查看提交的任务情况
ps -ef

在这里插入图片描述
中断任务 kill -9 taskid
如果是上面的任务id是229140

kill -9 229140

如果不记得当时的id,使用ps -ef查看运行状况,第二例就是
在这里插入图片描述

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柚子味的羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值