问题描述
在我暂停训练模型后,修改参数想继续训练时报错了,显存炸了,此时可以看到显存一点都没降,我就无法继续训练模型
解决方法
在资源管理器中关闭python的有关进程,可以看到显存可以使用了
若是使用jupyter,则可以重启内核来解决
若是使用服务
fuser -v /dev/nvidia* 查看占用的线程
sudo fuser -vk /dev/nvidia* 清楚所有的显存占用
在我暂停训练模型后,修改参数想继续训练时报错了,显存炸了,此时可以看到显存一点都没降,我就无法继续训练模型
在资源管理器中关闭python的有关进程,可以看到显存可以使用了
若是使用jupyter,则可以重启内核来解决
fuser -v /dev/nvidia* 查看占用的线程
sudo fuser -vk /dev/nvidia* 清楚所有的显存占用