1、在正常训练时,训练没有报错,但一直无法执行,卡在一个步骤,查看显存情况,显存应该是够的
2、在加入pdb调试时,出现许多内存不足的错误
【截图信息】
正常训练时显卡的情况
在pdb调试中报错信息
目前推断出,BUG的大致方向。 可以先进行以下尝试: 1. 升级mindspore,排除高版本影响 2. 设置batch_size = 1,排除机器性能影响
1、在正常训练时,训练没有报错,但一直无法执行,卡在一个步骤,查看显存情况,显存应该是够的
2、在加入pdb调试时,出现许多内存不足的错误
【截图信息】
正常训练时显卡的情况
在pdb调试中报错信息
目前推断出,BUG的大致方向。 可以先进行以下尝试: 1. 升级mindspore,排除高版本影响 2. 设置batch_size = 1,排除机器性能影响