训练模型时,出现NaN or Inf found in input tensor问题
原因是:模型训练过程中,出现梯度爆炸或梯度消失导致。
解决办法:调低学习率可解决。
“NaN or Inf found in input tensor“问题解决办法
于 2024-01-11 08:35:17 首次发布
训练模型时,出现NaN or Inf found in input tensor问题
原因是:模型训练过程中,出现梯度爆炸或梯度消失导致。
解决办法:调低学习率可解决。