原因有很多种,比如输入数据不对,或者模型有问题;
一般考虑梯度爆炸或者Loss爆炸,可以用debug模式检查问题的原因,观察什么时候出现的问题;
我产生的原因是在训练模型时,使用了model.eval(),将其改为model.train()后解决。
输出,loss出现-inf 或者nan
最新推荐文章于 2023-06-30 18:04:56 发布
原因有很多种,比如输入数据不对,或者模型有问题;
一般考虑梯度爆炸或者Loss爆炸,可以用debug模式检查问题的原因,观察什么时候出现的问题;
我产生的原因是在训练模型时,使用了model.eval(),将其改为model.train()后解决。