gpu out of memory

本文讲述了在服务器上编程时遇到的显卡内存不足(outofmemory)问题,通过检查发现是后台未释放的进程占用显存。解决方法是正确使用nohup命令确保命令在后台持续运行,即使关闭SSH连接也不影响程序执行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前几天在服务器上跑代码,碰见了一个新手级问题,却不好发现
具体而言就是服务器显卡报:

out of memory

这时候运行nvidia-smi查看显卡状态,发现显卡基本没有占用
进入python中

import torch
torch.rand(3).to.('cuda:0')

测试显卡,依然报out of memory
但这时

ps -aux | grep python

后发现后台挂着好几个进程
应该是这几个进程预定了显存却没有使用,造成out of memory却nvidia-smi发现显卡空闲
造成该问题的原因是很简单的错误
正确的后台挂起如下:

nohup python train.py >out1.txt 2>&1 &
nohup run.sh &

若是缺失了最后一个&,然后再关闭ssh链接,造成nohup意外中断就会造成上述现象

 

nohup 英文全称 no hang up(不挂起),用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行。

nohup 命令,在默认情况下(非重定向时),会输出一个名叫 nohup.out 的文件到当前目录下,如果当前目录的 nohup.out 文件不可写,输出重定向到$HOME/nohup.out 文件中。

语法格式:

 nohup Command [ Arg … ] [ & ]

参数说明:

Command:要执行的命令。

Arg:一些参数,可以指定输出文件。

&:让命令在后台执行,终端退出后命令仍旧执行。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值