2021-08-09

踩坑RuntimeError: CUDA error: device-side assert triggered

在训练模型的时候,常常修改模型后再运行就会报这个错误:”RuntimeError: CUDA error: device-side assert triggered“。经检查发现错的语句是:

train_x = Variable(torch.from_numpy(train_x).to(device))

在网上查找文档,大部分的错误原因是因为标签设置超出现有标签。我检查代码后发现我的标签和特征都没问题。最后发现是显存不足。上回运行时装载在GPU的tensor没有清楚。每次运行前都在命令提示符中执行:

nvidia-smi

找到显卡对应的任务然后输入:

taskkill -PID xxxx  -F

"xxxx"是该任务编号。这样就可以了。当然每次都要输入这些命令太麻烦,也可以减小batch让显存不那么快爆炸。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值