(Linux)显存被占用-显示没有进程-nohup

显存被占用-显示没有进程

​ 在深度学习(基于Pytorch)任务 nohup 后台训练时,可以用nvidia-smi命令查看进程的GPU运行状态,如图

nvidia-smi

在这里插入图片描述

当kill掉进程后,发现进程没有了,但是显存依然被占用。这种情况多半是代码中 num_works 的设置大于1导致的。nvidia-smi显示的PID是父进程,那么在kill掉此进程后,子进程仍然在工作。关键问题在于如何找到子进程并终止。

解决办法

  • 查找当前运行的所有进程,并找到自己执行时的命令
ps -aux

在这里插入图片描述

  • 根据程序执行命令彻底kill掉其他子进程
kill $(pgrep -f "python XXX.py --XXX")

为了防止出现此种情况,每次想kill掉进程的时候不要直接 kill,要同时kill掉当前进程与子进程(PID代表进程号):

kill $(pgrep -P PID)
  • 9
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值