张量运算失败报错RuntimeError:Malloc for kernel output failed, Memory isn’t enough

1 系统环境

硬件环境(Ascend/GPU/CPU): GPU

MindSpore版本: mindspore=1.10.1

执行模式(PyNative/ Graph):PyNative

Python版本: Python=3.7.5

操作系统平台: linux

2 报错信息

2.1 问题描述

在python的交互界面下运行脚本,环境显存为24G,在执行print(ms.ops.add(a,b))语句前显存占用为0,在执行完毕print(ms.ops.add(a,b))语句后,抛出错误,显存占用为18647M,未得到释放。

2.2 报错信息

RuntimeError:Malloc for kernel output failed, Memory isn’t enough, node:Default/Add-op0复制

2.3 脚本代码(代码格式,可上传附件)

import mindspore as ms
import numpy as np

ms.set_context(device_target="GPU")
a=ms.Tensor(np.ones([999,999,999]))
b=ms.Tensor(np.ones([999,999,999]))

print(ms.ops.add(a,b))复制

3 根因分析

应该是因为在python的交互界面进行执行失败后,对象a和b并没有释放,所以此时的a和b对应的显存也不会被释放。

4 解决方案

可以先用nvidia-smi查看下GPU的进程,具体进程调用GPU的情况可以用这个命令查看: pmap -d PID,

  1. 最后删除掉进程 kill id
  • 附件下载

  • 复现及解决问题脚本.rar

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值