下图是我当时遇到的问题
如上图,GPU1 显示占用了10G多的显存,但是却没有相应的进程。此时可使用如下命令查看进程:
fuser -v /dev/nvidia*
显示如下图:
此时把这些进程全部 kill 掉
kill -9 5142 5143 5144 5145 5146 5147 5148 5195 5196 5197
然后就可以了,看到如下的显示:
如果需要 kill 的进程特别多,并且想要全部都 kill 掉,可以使用以下的 python 脚本帮助 kill :
import os
pid = list(set(os.popen('fuser -v /dev/nvidia*').read().split()))
kill_cmd = 'kill -9 ' + ' '.join(pid)
print(kill_cmd)
os.popen(kill_cmd)
CenteOS安装fuser
yum install -y psmisc
结束,解决问题!
参考地址:https://blog.csdn.net/qq_33547191/article/details/86263859