PyTorch训练“WARNING:root:NaN or Inf found in input tensor”问题

问题

使用PyTorch训练开始时报以下警告:

WARNING:root:NaN or Inf found in input tensor

训练中也会偶尔再报同样的警告,但是似乎不影响正常训练。

分析

查了一下其他人也有报这个警告的情况,一般的解释都是模型训练过程中出现梯度消失或者梯度爆炸,或者数据中或数据处理过程中出现了脏数据。但是经过调试,发现不管是改大改小学习率都仍然出现此警告,抓取脏数据也抓取不到,在数据集的构造、网络的计算中也都没有发现脏数据。

分步调试后发现该警告出现在第一个epoch结束之后,即train和validation的正向和反向传播都完成之后。怀疑是在tensorboardX使用中的问题(这个issue也被怀疑是tensorboard的问题:NaN or Inf found in input tensor #223),于是仔细检查了tensorboardX语句中可能出现问题的部分。发现有一处add_image中输入的image值超过了1,于是将这一句注释掉再运行,果然不报警告了。

结论

除了模型训练过程中出现梯度消失或者梯度爆炸,或者数据中或数据处理过程中出现了脏数据,还有可能是tensorboardX使用中数据格式不符合规范。

  • 12
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值