GPU显存占用但nvidia-smi不显示进程号, nvtop出现N/A

本文介绍了在Linux系统中,当GPU进程在Ctrl+C后仍占用显存但nvidia-smi未显示进程号时,如何通过nvtop查找进程号、识别异常用户进程并使用`killallpython`或`sudokill`进行清理的步骤。操作需谨慎以避免误杀其他进程。
摘要由CSDN通过智能技术生成

(LINUX)

GPU进程Ctrl+C后依旧占用GPU显存但nvidia-smi不显示进程号

可以用nvtop查看到进程号,但是kill -9这个进程号没有效果

因为查了较长时间没找到很有效的指定显卡+指定用户的清除效果.
这里只有一个权宜之计.

服务器不建议重启, 接下来的操作当然需要管理员权限, 或者自己的进程出现问题,可以直接使用killall python解决问题.

所以第一步,自己的问题, killall python, 下面的思路一致,只是查找那个用户占用的,杀死他的进程.

第二步, nvtop上得知哪些是正常使用的, 这个需要有平时的观察.

第三步,
sudo fuser -v /dev/nvidia*

找到出问题的显卡号对应的用户名称, 我这里大部分显卡都显示相同, 所以也不一定.
可以看到某个用户停止使用了,但依旧有进程占用. 这些都是异常进程, 按照本文的粗暴方法,就直接杀掉. (如果没有把握,找到用户让他自己killall python)

第四步,
ps -ef | grep [这里填写异常用户名] | grep ‘python’
确认和第三步找到的进程一致,

第五步,
这一步执行后会造成可能杀错进程的问题, 一定注意!!!
ps -ef | grep [这里填写异常用户名] | grep ‘python’ | awk ‘{ print $2 }’ | sudo xargs kill -9

第六步,
查看nvidia-smi或者nvtop来确保整个过程完成无误.

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值