问题描述
在服务器上跑深度学习模型时,使用kill命令杀死进程后,使用nvidia-smi命令发现Processes是消失了,但显存仍有一部分被占用。
解决方法
本来以为可能是有僵尸进程,后来分析应该是有子进程的内存没有释放掉?具体操作:
fuser -v /dev/nvidia*
kill -9 pid
参考
- https://blog.csdn.net/weixin_46087812/article/details/123859352
- https://blog.csdn.net/weixin_39543655/article/details/116581900